LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-11 17:15:19 51人关注

​B 站开源文本转语音模型IndexTTS-2.0,情感与时长可控

近日,哔哩哔哩(B 站)Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0。该系统具有情感可控和时长可调的特点,标志着零样本 TTS 技术的实用化迈出了重要一步。

IndexTTS-2.0开源 零样本TTS技术 情感可控语音合成 时长可调TTS系统 哔哩哔哩Index团队 文本转语音开源项目

2025-08-26 18:43:21 227人关注

微软开源VibeVoice TTS模型:90分钟超长语音,可4人对话,中文效果惊艳!

近日,微软推出了一款备受瞩目的开源文本转语音(TTS)模型——VibeVoice,引发了AI语音技术领域的高度关注。这款模型以其强大的功能和卓越的性能,为长篇语音生成、多人对话以及中文语音合成树立了新的标杆。以下,AIbase将为您详细解析VibeVoice的亮点与潜力。

开源TTS模型 VibeVoice语音合成 微软AI语音技术 文本转语音模型 中文语音合成技术 多人对话语音生成

2025-07-24 13:18:43 262人关注

李沐团队发布 Higgs Audio v2,开创语音合成新纪元

知名 AI 创业者李沐与他的团队 Boson.ai 最近推出了全新的开源文本转语音(TTS)大模型 ——Higgs Audio v2。这款模型不仅可以将文本转换为语音,还具备多语言对话生成、韵律自动调整和声音克隆等多种功能,堪称语音合成领域的一次重大突破。

开源文本转语音模型 Higgs Audio v2 功能 语音合成技术突破 多语言对话生成 韵律自动调整 声音克隆技术

2025-07-04 16:25:14 398人关注

开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!

近日,法国AI实验室Kyutai宣布,其全新文本转语音模型 Kyutai TTS 正式开源,为全球开发者与研究者带来了一款高性能、低延迟的语音合成解决方案。这一突破性发布不仅推动了开源AI技术的发展,也为多语言语音交互应用开辟了新的可能性。AIbase为您独家解析这一技术亮点及其潜在影响。

Kyutai TTS 文本转语音模型 开源语音合成 AI语音交互 多语言语音合成 AI开源技术

2025-06-04 12:17:30 344人关注

B站文本转语音模型IndexTTS :支持拼音纠正汉字发音、精准控制停顿

B站的一款基于 XTTS 和 Tortoise 的 GPT 风格文本转语音(TTS)模型 IndexTTS 正式发布。该系统在处理中文文本时,具备独特的拼音纠正汉字发音能力,并能够通过标点符号在任意位置精准控制停顿。这一创新的技术使得文本转语音的效果更加自然流畅,受到了广泛关注。

bilibili文本转语音模型 IndexTTS 拼音校正技术 语音合成技术 文本转语音优化

2025-01-15 10:23:38 705人关注

小型文本转语音模型Kokoro-TTS,曾拿下TTS排行榜第一

在人工智能的快速发展中,语音合成技术正日益受到关注。近日,名为 Kokoro 的最新语音合成模型在 Hugging Face 平台上正式发布,该模型具有8200万参数,标志着语音合成领域的一个重要里程碑。

小文本语音模型 Kokoro TTS 语音合成技术 小型TTS模型 语音模型应用场景

2024-12-22 03:30:40 101人关注

超快速文本转语音模型Lightning:超低延迟, 100毫秒生成10秒音频

近日,总部位于美国加州旧金山的 AI 初创公司 smallest.ai 推出了其新产品 Lightning,一款能够在100毫秒内生成长达10秒音频的文本转语音(TTS)模型。此项技术的进步,使得全球开发者能够构建高仿真度的语音机器人应用,且延迟时间极短,降低了实施成本,提高了应用的可及性。

闪电文本转语音模型 100ms音频生成 快速TTS模型 文本转语音技术 低延迟语音合成

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10