上云资讯 - 来上云吧，企业上云一站式服务

2025-08-26 10:19:19 516人关注

微软开源 VibeVoice-1.5B 模型：90 分钟超长语音合成新突破

近日，微软研究院正式开源了其最新音频模型 ——VibeVoice-1.5B。该模型在语音合成技术上实现了多项重大突破，使得合成的语音更自然、时长更长、效果更优。

2025-07-24 13:18:43 621人关注

知名 AI 创业者李沐与他的团队 Boson.ai 最近推出了全新的开源文本转语音（TTS）大模型 ——Higgs Audio v2。这款模型不仅可以将文本转换为语音，还具备多语言对话生成、韵律自动调整和声音克隆等多种功能，堪称语音合成领域的一次重大突破。