LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-13 10:38:39 152人关注

0.33秒生成1秒音频!Muyan-TTS 开源上线,播客、有声书场景完美适配

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。

AI语音生成 Muyan TTS技术 音频生成技术 播客制作AI工具 TTS技术应用场景

2024-12-28 15:37:24 252人关注

告别繁琐对齐!F5-TTS 让文本转语音变得轻松自如!

最近,来自上海交通大学、剑桥大学和吉利汽车研究院的研究团队推出了一种全新的文本到语音(TTS)系统,名为 F5-TTS。这种系统的特别之处在于,它采用了一种无自回归的方法,结合了流匹配与扩散变换器(DiT),成功简化了传统 TTS 模型中的复杂步骤。

F5 TTS 文本转语音技术 TTS技术应用 F5 TTS告别 语音合成技术

2024-12-22 01:21:32 80人关注

OuteTTS-0.1-350M:一种新颖的文本转语音合成方法,具有零样本语音克隆功能

近日,Oute AI 发布了一种新颖的文本转语音合成方法,称为 OuteTTS-0.1-350M。这种方法利用纯语言建模,无需外部适配器或复杂架构,提供了一种简化的 TTS 方法。OuteTTS-0.1-350M 基于 LLaMa 架构,使用 WavTokenizer 直接生成音频标记,使得流程更加高效。

文本转语音 零样本语音克隆 TTS技术 语音合成 AI语音克隆 350M模型

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10