上云资讯 - 来上云吧，企业上云一站式服务

2025-09-01 13:28:17 376人关注

腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

近日，腾讯 ARC 团队发布了一款名为 AudioStory 的模型，旨在利用大语言模型（LLMs）生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。

2024-12-22 16:14:17 269人关注

在当今科技的浪潮中，对话式人工智能（AI）已经成为我们生活中的重要组成部分。然而，快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题，指的是输入与响应之间的时间差，常常让客服机器人和虚拟助手的体验变得缓慢，影响用户的使用感受。

2024-12-22 05:38:40 174人关注

一个革命性的开源音频模型——Hertz-dev横空出世，凭借其惊人的性能指标，让全球开发者为之震撼。这款拥有85亿参数的AI语音巨兽，通过2000万小时高质量音频数据的训练，成功实现了人类梦寐以求的全双工实时对话。