- 上云资讯 -
2025-01-22 01:43:32 407人关注
阿里通义实验室语音生成大模型CosyVoice升级2.0版本
阿里巴巴通义实验室语音团队宣布,其开源的语音生成大模型CosyVoice已升级至2.0版本,这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术,实现了双向流式语音合成,首包合成延迟可达到150ms,显著提升了语音合成的响应速度。
2025-01-16 08:42:41 89人关注
ElevenLabs发布Turbo 2.5模型:速度提升3倍,覆盖中文等32种语言
在人工智能的世界里,语言的界限正在被不断打破。ElevenLabs最新推出的Turbo2.5模型,以其卓越的性能和多语言支持,再次证明了这一点。
2025-01-05 16:28:11 205人关注
Soul语音大模型重磅升级:实时端到端语音通话 真人和AI虚拟人傻傻分不清楚!
在国内“AI+社交”这条赛道上,Soul App即将利用AI注入了新的活力!
2024-12-22 06:32:37 68人关注
Fish Audio发布Fish Agent V0.1 3B 实时语音克隆
近日,Fish Audio公司发布了全新的语音处理模型Fish Agent V0.13B,这款语音到语音模型能够高效、精确地生成和处理语音,尤其擅长模拟或克隆不同的声音。这意味着,我们距离拥有一个声音自然、反应迅速的AI语音助手又近了一步。