- 上云资讯 -
2025-01-22 01:43:32 300人关注
阿里通义实验室语音生成大模型CosyVoice升级2.0版本
阿里巴巴通义实验室语音团队宣布,其开源的语音生成大模型CosyVoice已升级至2.0版本,这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术,实现了双向流式语音合成,首包合成延迟可达到150ms,显著提升了语音合成的响应速度。
2025-01-12 14:28:15 106人关注
上交大携手字节跳动推出LSLM:AI语音模型实现"边听边说"突破
近日,上交大LANCE实验室和字节跳动联手推出了一款名为LSLM的新型交互式语音模型。据称,这款模型可以边听边说,效果非常好,接近人类自然的对话方式。
2025-01-01 17:23:17 100人关注
研究发现,AI语音模型在归纳推理中表现出色,在演绎任务中“碰壁”
最近,加州大学洛杉矶分校和亚马逊的研究人员对大型语言模型(LLMs)的推理能力进行了深入分析。他们首次系统地区分了归纳推理和演绎推理这两种能力,探讨了这两者对 AI 系统的挑战程度。
2024-12-22 06:32:37 27人关注
Fish Audio发布Fish Agent V0.1 3B 实时语音克隆
近日,Fish Audio公司发布了全新的语音处理模型Fish Agent V0.13B,这款语音到语音模型能够高效、精确地生成和处理语音,尤其擅长模拟或克隆不同的声音。这意味着,我们距离拥有一个声音自然、反应迅速的AI语音助手又近了一步。