上云资讯 - 来上云吧，企业上云一站式服务

2025-08-26 10:19:19 516人关注

微软开源 VibeVoice-1.5B 模型：90 分钟超长语音合成新突破

近日，微软研究院正式开源了其最新音频模型 ——VibeVoice-1.5B。该模型在语音合成技术上实现了多项重大突破，使得合成的语音更自然、时长更长、效果更优。

2025-01-16 00:35:39 302人关注

最近，Stability AI 团队推出了一款全新的开源音频生成模型，名为 Stable Audio Open。这款模型的特别之处在于，它能够从文本提示生成时长可达47秒的立体声音频，采样率高达44.1kHz。