微信扫码
添加专属顾问
2025-08-26 10:19:19 169人关注
近日,微软研究院正式开源了其最新音频模型 ——VibeVoice-1.5B。该模型在语音合成技术上实现了多项重大突破,使得合成的语音更自然、时长更长、效果更优。
微软音频模型开源 VibeVoice-1.5B 语音合成技术突破 自然语音合成 长音频合成 微软研究院音频模型
2025-07-24 13:18:43 263人关注
知名 AI 创业者李沐与他的团队 Boson.ai 最近推出了全新的开源文本转语音(TTS)大模型 ——Higgs Audio v2。这款模型不仅可以将文本转换为语音,还具备多语言对话生成、韵律自动调整和声音克隆等多种功能,堪称语音合成领域的一次重大突破。
开源文本转语音模型 Higgs Audio v2 功能 语音合成技术突破 多语言对话生成 韵律自动调整 声音克隆技术