- 上云资讯 -
2025-06-04 12:17:30 208人关注
B站文本转语音模型IndexTTS :支持拼音纠正汉字发音、精准控制停顿
B站的一款基于 XTTS 和 Tortoise 的 GPT 风格文本转语音(TTS)模型 IndexTTS 正式发布。该系统在处理中文文本时,具备独特的拼音纠正汉字发音能力,并能够通过标点符号在任意位置精准控制停顿。这一创新的技术使得文本转语音的效果更加自然流畅,受到了广泛关注。
2025-03-25 16:26:10 114人关注
ZyphraAI 开源 Zonos-TTS:支持实时语音克隆和多语言情感控制
ZyphraAI 近日发布了其最新的多语言文本到语音(TTS)模型 Zonos-TTS,该模型基于 Apache2.0许可证,完全开源且可商用。Zonos-TTS 不仅支持实时语音克隆功能,还经过20万小时的英语语音数据训练,表现出卓越的性能。
2025-02-26 16:19:12 112人关注
ElevenLabs向所有作家开放AI有声读物出版计划,与Audible竞争
据TechCrunch消息,语音AI公司ElevenLabs现已允许作者在其阅读器应用上发布AI生成的有声读物,此前该公司与Spotify合作推出AI叙述有声读物。
ElevenLabs AI Audiobook publishing Audible competition AI有声书出版 AI语音合成技术
2025-01-15 10:23:38 591人关注
小型文本转语音模型Kokoro-TTS,曾拿下TTS排行榜第一
在人工智能的快速发展中,语音合成技术正日益受到关注。近日,名为 Kokoro 的最新语音合成模型在 Hugging Face 平台上正式发布,该模型具有8200万参数,标志着语音合成领域的一个重要里程碑。
2025-01-13 09:13:23 276人关注
未来已来!阿里新语音技术CosyVoice让AI说话更有人味儿
近日,阿里巴巴推出的最新语音合成模型CosyVoice,以其令人惊叹的逼真度和灵活性,为我们展示了未来人机交互的美好蓝图。
2025-01-09 12:18:21 248人关注
ChatTTS-OpenVoice:一款开源的个性化语音生成项目
近日,一款名为ChatTTS-OpenVoice的个性化语音生成项目在互联网上引起了轰动。
2025-01-04 19:20:30 117人关注
Audible 推出 AI 生成有声读物,叙述者将训练并参与创作
亚马逊的有声读物业务Audible于周一宣布,将使用经过专业叙述者声音训练的人工智能技术生成新的有声读物录音。Audible计划从本周开始,邀请一批美国专业有声读物叙述者参与AI声音训练项目。
2025-01-03 20:36:44 342人关注
Fish Speech 1.4发布:开源TTS模型迎来多语言突破
Fish Speech1.4版本的发布标志着这款开源文本转语音(TTS)模型在多语言支持和性能方面取得了重大突破。作为一个致力于提供高质量、自然流畅语音合成体验的创新解决方案,Fish Speech在这次更新中展现了其强大的技术实力和广阔的应用前景。
2024-12-23 17:18:22 78人关注
OpenAI 重磅升级实时 API:除了降价超50%,还推五种新语音
今天,OpenAI 宣布对其实时 API 进行更新,目前该 API 仍处于测试阶段。这次更新的亮点在于推出了五种新的语音选项,专为语音到语音应用而设计,同时还降低了相关的缓存费用,让开发者在使用时更加经济实惠。
2024-12-20 08:20:20 82人关注
对标谷歌NotebookLM!语音生成模型PlayDialog:可生成对话播客、旁白
近日,Play AI 正式推出其最具雄心的产品 ——PlayDialog beta版本,能生成对话式的播客音频。