微信扫码
添加专属顾问
2025-05-13 10:38:39 151人关注
开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。
AI语音生成 Muyan TTS技术 音频生成技术 播客制作AI工具 TTS技术应用场景
2024-12-28 15:37:24 251人关注
最近,来自上海交通大学、剑桥大学和吉利汽车研究院的研究团队推出了一种全新的文本到语音(TTS)系统,名为 F5-TTS。这种系统的特别之处在于,它采用了一种无自回归的方法,结合了流匹配与扩散变换器(DiT),成功简化了传统 TTS 模型中的复杂步骤。
F5 TTS 文本转语音技术 TTS技术应用 F5 TTS告别 语音合成技术