上云资讯 - 来上云吧，企业上云一站式服务

AI对话上云服务上云资讯解决方案关于我们

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-11 17:15:19 681人关注

B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控

近日，哔哩哔哩（B 站）Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0。该系统具有情感可控和时长可调的特点，标志着零样本 TTS 技术的实用化迈出了重要一步。

IndexTTS-2.0开源零样本TTS技术情感可控语音合成时长可调TTS系统哔哩哔哩Index团队文本转语音开源项目

2025-05-13 10:38:39 519人关注

0.33秒生成1秒音频!Muyan-TTS 开源上线，播客、有声书场景完美适配

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计，具备零样本语音合成、极速生成与高连贯性朗读能力，是当前最适合批量化长语音生成的模型之一。

AI语音生成 Muyan TTS技术音频生成技术播客制作AI工具 TTS技术应用场景

2024-12-28 15:37:24 514人关注

告别繁琐对齐！F5-TTS 让文本转语音变得轻松自如！

最近，来自上海交通大学、剑桥大学和吉利汽车研究院的研究团队推出了一种全新的文本到语音（TTS）系统，名为 F5-TTS。这种系统的特别之处在于，它采用了一种无自回归的方法，结合了流匹配与扩散变换器(DiT)，成功简化了传统 TTS 模型中的复杂步骤。

F5 TTS 文本转语音技术 TTS技术应用 F5 TTS告别语音合成技术

2024-12-22 01:21:32 221人关注

OuteTTS-0.1-350M:一种新颖的文本转语音合成方法，具有零样本语音克隆功能

近日，Oute AI 发布了一种新颖的文本转语音合成方法，称为 OuteTTS-0.1-350M。这种方法利用纯语言建模，无需外部适配器或复杂架构，提供了一种简化的 TTS 方法。OuteTTS-0.1-350M 基于 LLaMa 架构，使用 WavTokenizer 直接生成音频标记，使得流程更加高效。

文本转语音零样本语音克隆 TTS技术语音合成 AI语音克隆 350M模型

- 上云资讯 -

B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控

0.33秒生成1秒音频!Muyan-TTS 开源上线，播客、有声书场景完美适配

告别繁琐对齐！F5-TTS 让文本转语音变得轻松自如！

OuteTTS-0.1-350M:一种新颖的文本转语音合成方法，具有零样本语音克隆功能

推荐阅读

上云服务

- 上云资讯 -

​B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控

0.33秒生成1秒音频!Muyan-TTS 开源上线，播客、有声书场景完美适配

告别繁琐对齐！F5-TTS 让文本转语音变得轻松自如！

OuteTTS-0.1-350M:一种新颖的文本转语音合成方法，具有零样本语音克隆功能

推荐阅读

上云服务

B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控