LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-26 10:19:19 169人关注

微软开源 VibeVoice-1.5B 模型:90 分钟超长语音合成新突破

近日,微软研究院正式开源了其最新音频模型 ——VibeVoice-1.5B。该模型在语音合成技术上实现了多项重大突破,使得合成的语音更自然、时长更长、效果更优。

微软音频模型开源 VibeVoice-1.5B 语音合成技术突破 自然语音合成 长音频合成 微软研究院音频模型

2025-01-16 00:35:39 153人关注

Stability AI开源音频生成模型Stable Audio Open:可生成47秒的立体声音频

最近,Stability AI 团队推出了一款全新的开源音频生成模型,名为 Stable Audio Open。这款模型的特别之处在于,它能够从文本提示生成时长可达47秒的立体声音频,采样率高达44.1kHz。

Stability AI Stable Audio AI音频生成 AI音频技术 Stability AI新闻 音频模型开源

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10