- 上云资讯 -
2025-08-01 18:14:43 20人关注
MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者
由清华大学语音与语言实验室(Tencent AI Lab)联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源,标志着AI语音合成技术在对话场景中的重大突破。
AI语音合成 语音对话技术 MOSS-TTSD开源 清华大学语音与语言实验室 Tencent AI Lab 语音合成 文本转语音对话系统
2025-07-01 16:32:16 209人关注
Qwen-TTS重磅发布:方言语音合成新突破,真实感媲美真人
昨日,阿里巴巴通义团队正式推出了Qwen-TTS模型,这款文本转语音(TTS)模型以其超高真实感和多方言支持引发行业热议。AIbase编辑团队整理最新信息,为您深入解析这款通过Qwen API提供服务的语音合成利器,及其在AI语音技术领域的突破性意义。
2025-05-11 16:18:31 78人关注
Spotify与ElevenLabs合作 推出AI朗读有声书选项
在周四,Spotify 宣布与 ElevenLabs 达成合作,正式接受使用该公司 AI 语音技术朗读的有声书。作为目前最受认可的 AI 音频提供商之一,这项新伙伴关系预计将显著增加平台上 AI 朗读有声书的数量。
2025-02-26 16:19:12 112人关注
ElevenLabs向所有作家开放AI有声读物出版计划,与Audible竞争
据TechCrunch消息,语音AI公司ElevenLabs现已允许作者在其阅读器应用上发布AI生成的有声读物,此前该公司与Spotify合作推出AI叙述有声读物。
ElevenLabs AI Audiobook publishing Audible competition AI有声书出版 AI语音合成技术
2025-01-23 12:22:13 153人关注
闪速!ElevenLabs推Flash语音对话模型:仅75毫秒延迟 支持32种语言
ElevenLabs 于近日正式推出其最新的人声合成模型 Flash,声称这是迄今为止最快的文本转语音(TTS)解决方案,生成语音的延迟仅为75毫秒(加上应用和网络延迟)。Flash 特别适合低延迟的对话式语音助手,用户可以在 ElevenLabs 的对话 AI 平台上立即体验这一新功能。
2025-01-17 22:27:44 131人关注
OpenAI在开发者Playground中添加了文本转语音 API
OpenAI将文本转语音 API 添加到了开发者Playground 中,这个更新让开发者的工作变得更加轻松,只需简单地输入文本消息,就能在六种预设的声音中选择,生成音频。
OpenAI文本转语音API OpenAI TTS API 文本转语音技术 OpenAI语音合成 OpenAI API应用
2025-01-15 13:19:41 136人关注
配音员危!微软VALL-E 2模型语音克隆达到配音员水准
近日,微软发布的零样本文本到语音(TTS)模型VALLE-2在技术界引起广泛关注。这一突破性成果首次实现了与人类同等水平的语音合成,被认为是TTS领域的里程碑式进展。
2025-01-13 09:13:23 276人关注
未来已来!阿里新语音技术CosyVoice让AI说话更有人味儿
近日,阿里巴巴推出的最新语音合成模型CosyVoice,以其令人惊叹的逼真度和灵活性,为我们展示了未来人机交互的美好蓝图。
2025-01-04 19:20:30 117人关注
Audible 推出 AI 生成有声读物,叙述者将训练并参与创作
亚马逊的有声读物业务Audible于周一宣布,将使用经过专业叙述者声音训练的人工智能技术生成新的有声读物录音。Audible计划从本周开始,邀请一批美国专业有声读物叙述者参与AI声音训练项目。
2024-12-23 10:22:10 86人关注
清华大学推出突破性音源仿真平台SonicSim AI语音处理要起飞了?
清华大学的研究团队近日发布了名为 SonicSim 的移动音源仿真平台,旨在解决当前语音处理领域在移动声源场景下数据缺乏的难题。
2024-12-22 23:18:31 84人关注
ElevenLabs推开源小项目X-to-Voice:一键将Twitter账号转化为个性化虚拟形象
人工智能公司ElevenLabs最近发布了一个引人注目的开源项目"X-to-Voice",这款工具能够智能分析Twitter用户资料,自动生成与用户个性相匹配的数字声音和动态头像。