上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-11 17:15:19 680人关注

B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控

近日，哔哩哔哩（B 站）Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0。该系统具有情感可控和时长可调的特点，标志着零样本 TTS 技术的实用化迈出了重要一步。

IndexTTS-2.0开源零样本TTS技术情感可控语音合成时长可调TTS系统哔哩哔哩Index团队文本转语音开源项目

2025-08-26 18:43:21 811人关注

微软开源VibeVoice TTS模型：90分钟超长语音，可4人对话，中文效果惊艳！

近日，微软推出了一款备受瞩目的开源文本转语音（TTS）模型——VibeVoice，引发了AI语音技术领域的高度关注。这款模型以其强大的功能和卓越的性能，为长篇语音生成、多人对话以及中文语音合成树立了新的标杆。以下，AIbase将为您详细解析VibeVoice的亮点与潜力。

开源TTS模型 VibeVoice语音合成微软AI语音技术文本转语音模型中文语音合成技术多人对话语音生成

2025-07-24 13:18:43 621人关注

李沐团队发布 Higgs Audio v2，开创语音合成新纪元

知名 AI 创业者李沐与他的团队 Boson.ai 最近推出了全新的开源文本转语音（TTS）大模型 ——Higgs Audio v2。这款模型不仅可以将文本转换为语音，还具备多语言对话生成、韵律自动调整和声音克隆等多种功能，堪称语音合成领域的一次重大突破。

开源文本转语音模型 Higgs Audio v2 功能语音合成技术突破多语言对话生成韵律自动调整声音克隆技术

2025-07-04 16:25:14 585人关注

开源革命！Kyutai TTS发布：超低延迟语音合成，AI语音新纪元来袭！

近日，法国AI实验室Kyutai宣布，其全新文本转语音模型 Kyutai TTS 正式开源，为全球开发者与研究者带来了一款高性能、低延迟的语音合成解决方案。这一突破性发布不仅推动了开源AI技术的发展，也为多语言语音交互应用开辟了新的可能性。AIbase为您独家解析这一技术亮点及其潜在影响。

Kyutai TTS 文本转语音模型开源语音合成 AI语音交互多语言语音合成 AI开源技术

2025-06-04 12:17:30 885人关注

B站文本转语音模型IndexTTS ：支持拼音纠正汉字发音、精准控制停顿

B站的一款基于 XTTS 和 Tortoise 的 GPT 风格文本转语音（TTS）模型 IndexTTS 正式发布。该系统在处理中文文本时，具备独特的拼音纠正汉字发音能力，并能够通过标点符号在任意位置精准控制停顿。这一创新的技术使得文本转语音的效果更加自然流畅，受到了广泛关注。

bilibili文本转语音模型 IndexTTS 拼音校正技术语音合成技术文本转语音优化

2025-01-15 10:23:38 1161人关注

小型文本转语音模型Kokoro-TTS，曾拿下TTS排行榜第一

在人工智能的快速发展中，语音合成技术正日益受到关注。近日，名为 Kokoro 的最新语音合成模型在 Hugging Face 平台上正式发布，该模型具有8200万参数，标志着语音合成领域的一个重要里程碑。

小文本语音模型 Kokoro TTS 语音合成技术小型TTS模型语音模型应用场景

2024-12-22 03:30:40 244人关注

超快速文本转语音模型Lightning：超低延迟， 100毫秒生成10秒音频

近日，总部位于美国加州旧金山的 AI 初创公司 smallest.ai 推出了其新产品 Lightning，一款能够在100毫秒内生成长达10秒音频的文本转语音（TTS）模型。此项技术的进步，使得全球开发者能够构建高仿真度的语音机器人应用，且延迟时间极短，降低了实施成本，提高了应用的可及性。

闪电文本转语音模型 100ms音频生成快速TTS模型文本转语音技术低延迟语音合成

- 上云资讯 -

B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控

微软开源VibeVoice TTS模型：90分钟超长语音，可4人对话，中文效果惊艳！

李沐团队发布 Higgs Audio v2，开创语音合成新纪元

开源革命！Kyutai TTS发布：超低延迟语音合成，AI语音新纪元来袭！

B站文本转语音模型IndexTTS ：支持拼音纠正汉字发音、精准控制停顿

小型文本转语音模型Kokoro-TTS，曾拿下TTS排行榜第一

超快速文本转语音模型Lightning：超低延迟， 100毫秒生成10秒音频

推荐阅读

上云服务

- 上云资讯 -

​B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控

微软开源VibeVoice TTS模型：90分钟超长语音，可4人对话，中文效果惊艳！

李沐团队发布 Higgs Audio v2，开创语音合成新纪元

开源革命！Kyutai TTS发布：超低延迟语音合成，AI语音新纪元来袭！

B站文本转语音模型IndexTTS ：支持拼音纠正汉字发音、精准控制停顿

小型文本转语音模型Kokoro-TTS，曾拿下TTS排行榜第一

超快速文本转语音模型Lightning：超低延迟， 100毫秒生成10秒音频

推荐阅读

上云服务

B 站开源文本转语音模型IndexTTS-2.0，情感与时长可控