- 上云资讯 -
2025-09-01 13:28:17 72人关注
腾讯ARC开源音频模型 AudioStory:用大语言模型生成长音频
近日,腾讯 ARC 团队发布了一款名为 AudioStory 的模型,旨在利用大语言模型(LLMs)生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。
腾讯ARC团队AudioStory模型 大语言模型生成长篇音频 文本到音频生成技术 长篇叙事音频时间连贯性 音频生成组合推理挑战
2024-12-22 16:14:17 131人关注
全新开源音频模型Hertz-Dev:超低延迟,实现AI实时对话
在当今科技的浪潮中,对话式人工智能(AI)已经成为我们生活中的重要组成部分。然而,快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题,指的是输入与响应之间的时间差,常常让客服机器人和虚拟助手的体验变得缓慢,影响用户的使用感受。