LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-01 13:28:17 72人关注

​腾讯ARC开源音频模型 AudioStory:用大语言模型生成长音频

近日,腾讯 ARC 团队发布了一款名为 AudioStory 的模型,旨在利用大语言模型(LLMs)生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。

腾讯ARC团队AudioStory模型 大语言模型生成长篇音频 文本到音频生成技术 长篇叙事音频时间连贯性 音频生成组合推理挑战

2024-12-22 16:14:17 131人关注

全新开源音频模型Hertz-Dev:超低延迟,实现AI实时对话

在当今科技的浪潮中,对话式人工智能(AI)已经成为我们生活中的重要组成部分。然而,快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题,指的是输入与响应之间的时间差,常常让客服机器人和虚拟助手的体验变得缓慢,影响用户的使用感受。

开源音频模型 实时AI对话 超低延迟AI Hertz Dev 技术 AI音频处理技术

2024-12-22 05:38:40 82人关注

首个会话音频开源模型Hertz-dev 120毫秒超低延迟惊艳全网

一个革命性的开源音频模型——Hertz-dev横空出世,凭借其惊人的性能指标,让全球开发者为之震撼。这款拥有85亿参数的AI语音巨兽,通过2000万小时高质量音频数据的训练,成功实现了人类梦寐以求的全双工实时对话。

音频开源模型 Hertz Dev 开源音频模型 音频模型技术 音频AI开发

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10