上云资讯 - 来上云吧，企业上云一站式服务

2025-08-09 14:45:35 389人关注

FlowSpeech：全球首个书面语转口语的 TTS

人工智能语音合成技术迎来新突破。一款名为FlowSpeech的AI文本转语音工具正式发布，其独特之处在于能够将书面文字转换为自然流畅的口语表达，为用户提供更贴近真实对话的语音合成体验。

AI语音合成 FlowSpeech 文本转语音工具自然流畅语音合成 AI口语表达技术

2025-08-01 18:14:43 452人关注

MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者

由清华大学语音与语言实验室（Tencent AI Lab）联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源，标志着AI语音合成技术在对话场景中的重大突破。

AI语音合成语音对话技术 MOSS-TTSD开源清华大学语音与语言实验室 Tencent AI Lab 语音合成文本转语音对话系统

2025-07-01 16:32:16 804人关注

Qwen-TTS重磅发布：方言语音合成新突破，真实感媲美真人

昨日，阿里巴巴通义团队正式推出了Qwen-TTS模型，这款文本转语音（TTS）模型以其超高真实感和多方言支持引发行业热议。AIbase编辑团队整理最新信息，为您深入解析这款通过Qwen API提供服务的语音合成利器，及其在AI语音技术领域的突破性意义。

阿里巴巴通义 Qwen-TTS模型文本转语音技术 AI语音合成多方言TTS Qwen API服务

2025-05-11 16:18:31 236人关注

Spotify与ElevenLabs合作推出AI朗读有声书选项

在周四，Spotify 宣布与 ElevenLabs 达成合作，正式接受使用该公司 AI 语音技术朗读的有声书。作为目前最受认可的 AI 音频提供商之一，这项新伙伴关系预计将显著增加平台上 AI 朗读有声书的数量。

Spotify ElevenLabs AI有声书 AI生成有声读物 Spotify AI音频技术 AI语音合成应用

2025-03-15 10:12:14 593人关注

Sesame发布CSM模型：实时情感定制 AI语音合成迈向新高度

3月13日，Sesame公司推出其最新语音合成模型CSM，引发业界关注。据官方介绍，CSM采用端到端基于Transformer的多模态学习架构，能够理解上下文信息，生成自然且富有情感的语音，声音效果贴近真人，令人惊艳。

实时情绪AI 语音情感识别芝麻CSM模型 AI语音技术情感计算模型

2025-02-26 16:19:12 297人关注

ElevenLabs向所有作家开放AI有声读物出版计划，与Audible竞争

据TechCrunch消息，语音AI公司ElevenLabs现已允许作者在其阅读器应用上发布AI生成的有声读物，此前该公司与Spotify合作推出AI叙述有声读物。

ElevenLabs AI Audiobook publishing Audible competition AI有声书出版 AI语音合成技术

2025-02-18 10:15:33 414人关注

HYBE旗下AI 声音工具Supertone Play上线：10秒搞定声音克隆

近日，HYBE 旗下的人工智能语音公司 Supertone 宣布推出了一款名为 “Supertone Play” 的文本转语音工具，旨在生成高质量、富有表现力的音频内容。这款新工具目前支持英语、韩语和日语，预计在今年内将扩展至西班牙语和中文。

AI语音克隆 HYBE Supertone AI语音技术 AI声音复制 AI语音合成 AI语音克隆应用

2025-01-23 12:22:13 468人关注

闪速！ElevenLabs推Flash语音对话模型：仅75毫秒延迟支持32种语言

ElevenLabs 于近日正式推出其最新的人声合成模型 Flash，声称这是迄今为止最快的文本转语音（TTS）解决方案，生成语音的延迟仅为75毫秒(加上应用和网络延迟)。Flash 特别适合低延迟的对话式语音助手，用户可以在 ElevenLabs 的对话 AI 平台上立即体验这一新功能。

ElevenLabs语音模型 75ms延迟语音合成 32种语言支持实时语音技术 AI语音合成进展

2025-01-19 16:41:41 267人关注

印度AI初创公司NeuralGarage利用AI实现影视配音完美同步

在观看配音电影时，观众常常会遇到一个问题:角色的口型与配音语言不匹配，这不仅影响了观影体验，也让人难以沉浸在故事中。为了改变这一现状，成立于2021年的印度创业公司 NeuralGarage 正在积极努力，试图彻底改变配音行业。

印度AI创业公司 AI配音技术 NeuralGarage 完美配音 AI语音合成 AI创业公司案例

2025-01-17 22:27:44 286人关注

OpenAI在开发者Playground中添加了文本转语音 API

OpenAI将文本转语音 API 添加到了开发者Playground 中，这个更新让开发者的工作变得更加轻松，只需简单地输入文本消息，就能在六种预设的声音中选择，生成音频。

OpenAI文本转语音API OpenAI TTS API 文本转语音技术 OpenAI语音合成 OpenAI API应用

2025-01-15 13:19:41 342人关注

配音员危！微软VALL-E 2模型语音克隆达到配音员水准

近日，微软发布的零样本文本到语音（TTS）模型VALLE-2在技术界引起广泛关注。这一突破性成果首次实现了与人类同等水平的语音合成，被认为是TTS领域的里程碑式进展。

语音克隆技术微软VALL-E 2 AI语音合成语音克隆应用场景语音克隆技术原理

2025-01-13 09:13:23 568人关注

未来已来!阿里新语音技术CosyVoice让AI说话更有人味儿

近日，阿里巴巴推出的最新语音合成模型CosyVoice，以其令人惊叹的逼真度和灵活性，为我们展示了未来人机交互的美好蓝图。

阿里云语音AI CosyVoice AI语音技术阿里云语音合成 AI语音合成技术阿里云语音AI应用场景

2025-01-10 15:14:40 406人关注

Eleven Labs推出全托管AI自动配音服务一键让你"说"多国语言

近日，人工智能语音技术公司Eleven Labs推出了一项令人瞩目的全托管AI自动配音服务，为内容创作者和企业提供了一个突破语言障碍的创新解决方案。

AI配音服务 ElevenLabs AI配音 AI语音克隆技术 AI语音合成 AI配音应用场景 AI配音技术原理

2025-01-04 19:20:30 319人关注

Audible 推出 AI 生成有声读物，叙述者将训练并参与创作

亚马逊的有声读物业务Audible于周一宣布，将使用经过专业叙述者声音训练的人工智能技术生成新的有声读物录音。Audible计划从本周开始，邀请一批美国专业有声读物叙述者参与AI声音训练项目。

AI有声书 AI生成有声书 AI语音合成技术 AI有声书制作 AI语音合成应用场景

2025-01-04 17:42:39 357人关注

亚马逊推出新功能：让有声读物解说员用 AI “克隆” 自己

最近，亚马逊宣布将开始邀请一小部分 Audible 有声读物解说员参与一个新的测试项目，目的就是利用 AI 技术来快速制作有声书。

AI语音克隆亚马逊AI有声书 AI有声书旁白 AI语音合成技术 AI克隆技术应用

2025-01-02 21:21:33 322人关注

腾讯出品！AI音频模型 EzAudio AI，让文本秒变逼真声音

近日，约翰霍普金斯大学与腾讯 AI 实验室联合推出了一款名为 EzAudio 的新型文本到音频生成模型。这项技术承诺以空前的效率和高品质文本转换为声音，标志着人工智能和音频技术的重大飞跃。

腾讯EZAUDIO AI语音合成文本转语音技术 AI语音生成腾讯AI语音技术

2024-12-24 20:18:20 437人关注

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

近日，字节跳动开发了一款名为PersonaTalk的AI模型，该模型可以为视频精准配音。

字节跳动AI配音 AI语音合成技术 AI配音应用场景字节跳动AI技术 AI语音生成

2024-12-24 08:13:39 490人关注

雷军回应AI配音被恶搞：希望大家不要再玩了让自己挺不舒服

小米公司CEO雷军近日通过视频就网络上流传的“雷军AI”配音恶搞现象进行了首次回应。雷军提到，随着AI技术的快速发展，自己的声音被制作成语音包并在多个视频中被滥用，甚至有用户反映在国庆期间被这种恶搞内容“骂”了整整七天。

雷军AI配音 AI配音技术雷军回应AI配音 AI语音合成 AI配音应用场景

2024-12-23 10:22:10 250人关注

清华大学推出突破性音源仿真平台SonicSim AI语音处理要起飞了？

清华大学的研究团队近日发布了名为 SonicSim 的移动音源仿真平台，旨在解决当前语音处理领域在移动声源场景下数据缺乏的难题。

清华AI语音平台 SonicSim AI语音技术 AI语音合成语音模拟技术清华声学仿真平台

2024-12-22 23:18:31 274人关注

ElevenLabs推开源小项目X-to-Voice：一键将Twitter账号转化为个性化虚拟形象

人工智能公司ElevenLabs最近发布了一个引人注目的开源项目"X-to-Voice"，这款工具能够智能分析Twitter用户资料，自动生成与用户个性相匹配的数字声音和动态头像。

ElevenLabs 开源语音技术 Twitter虚拟化身 AI语音合成虚拟形象生成

- 上云资讯 -

FlowSpeech：全球首个书面语转口语的 TTS

MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者

Qwen-TTS重磅发布：方言语音合成新突破，真实感媲美真人

Spotify与ElevenLabs合作推出AI朗读有声书选项

Sesame发布CSM模型：实时情感定制 AI语音合成迈向新高度

ElevenLabs向所有作家开放AI有声读物出版计划，与Audible竞争

HYBE旗下AI 声音工具Supertone Play上线：10秒搞定声音克隆

闪速！ElevenLabs推Flash语音对话模型：仅75毫秒延迟支持32种语言

印度AI初创公司NeuralGarage利用AI实现影视配音完美同步

OpenAI在开发者Playground中添加了文本转语音 API

配音员危！微软VALL-E 2模型语音克隆达到配音员水准

未来已来!阿里新语音技术CosyVoice让AI说话更有人味儿

Eleven Labs推出全托管AI自动配音服务一键让你"说"多国语言

Audible 推出 AI 生成有声读物，叙述者将训练并参与创作

亚马逊推出新功能：让有声读物解说员用 AI “克隆” 自己

腾讯出品！AI音频模型 EzAudio AI，让文本秒变逼真声音

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

雷军回应AI配音被恶搞：希望大家不要再玩了让自己挺不舒服

清华大学推出突破性音源仿真平台SonicSim AI语音处理要起飞了？

ElevenLabs推开源小项目X-to-Voice：一键将Twitter账号转化为个性化虚拟形象

推荐阅读

上云服务

- 上云资讯 -

FlowSpeech：全球首个书面语转口语的 TTS

MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者

Qwen-TTS重磅发布：方言语音合成新突破，真实感媲美真人

Spotify与ElevenLabs合作 推出AI朗读有声书选项

Sesame发布CSM模型：实时情感定制 AI语音合成迈向新高度

ElevenLabs向所有作家开放AI有声读物出版计划，与Audible竞争

HYBE旗下AI 声音工具Supertone Play上线：10秒搞定声音克隆

闪速！ElevenLabs推Flash语音对话模型：仅75毫秒延迟 支持32种语言

印度AI初创公司NeuralGarage利用AI实现影视配音完美同步

OpenAI在开发者Playground中添加了文本转语音 API

配音员危！微软VALL-E 2模型语音克隆达到配音员水准

未来已来!阿里新语音技术CosyVoice让AI说话更有人味儿

Eleven Labs推出全托管AI自动配音服务 一键让你"说"多国语言

Audible 推出 AI 生成有声读物，叙述者将训练并参与创作

亚马逊推出新功能：让有声读物解说员用 AI “克隆” 自己

腾讯出品！AI音频模型 EzAudio AI，让文本秒变逼真声音

告别配音演员？字节跳动PersonaTalk让AI精准配音，连表情细节都完美还原！

雷军回应AI配音被恶搞：希望大家不要再玩了 让自己挺不舒服

清华大学推出突破性音源仿真平台SonicSim AI语音处理要起飞了？

ElevenLabs推开源小项目X-to-Voice：一键将Twitter账号转化为个性化虚拟形象

推荐阅读

上云服务

Spotify与ElevenLabs合作推出AI朗读有声书选项

闪速！ElevenLabs推Flash语音对话模型：仅75毫秒延迟支持32种语言

Eleven Labs推出全托管AI自动配音服务一键让你"说"多国语言

雷军回应AI配音被恶搞：希望大家不要再玩了让自己挺不舒服