上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-27 18:11:42 373人关注

OpenAI免费开放ChatGPT高级语音聊天模式基于GPT-4o mini

2月26日，OpenAI公司在X平台发布推文，正式向广大用户宣布，即日起将免费开放ChatGPT的高级语音模式（Advanced Voice Mode）。

OpenAI ChatGPT GPT-4 Mini 高级语音技术 AI语音模型 OpenAI新闻

2025-01-22 01:43:32 954人关注

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

阿里巴巴通义实验室语音团队宣布，其开源的语音生成大模型CosyVoice已升级至2.0版本，这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术，实现了双向流式语音合成，首包合成延迟可达到150ms，显著提升了语音合成的响应速度。

通义千问升级 CosyVoice-2 AI语音模型语音技术升级通义千问新功能

2025-01-16 08:42:41 280人关注

ElevenLabs发布Turbo 2.5模型：速度提升3倍，覆盖中文等32种语言

在人工智能的世界里，语言的界限正在被不断打破。ElevenLabs最新推出的Turbo2.5模型，以其卓越的性能和多语言支持，再次证明了这一点。

ElevenLabs Turbo 2.5模型 3倍速度提升 32种语言支持 AI语音模型升级 ElevenLabs新闻

2025-01-12 14:28:15 352人关注

上交大携手字节跳动推出LSLM：AI语音模型实现"边听边说"突破

近日，上交大LANCE实验室和字节跳动联手推出了一款名为LSLM的新型交互式语音模型。据称，这款模型可以边听边说，效果非常好，接近人类自然的对话方式。

上海交大字节跳动 LSLM AI语音模型语音模型技术

2025-01-05 16:28:11 509人关注

Soul语音大模型重磅升级：实时端到端语音通话真人和AI虚拟人傻傻分不清楚！

在国内“AI+社交”这条赛道上，Soul App即将利用AI注入了新的活力!

Soul Voice模型升级实时AI通话 AI语音模型语音技术升级 AI通话技术

2025-01-01 17:23:17 348人关注

研究发现，AI语音模型在归纳推理中表现出色，在演绎任务中“碰壁”

最近，加州大学洛杉矶分校和亚马逊的研究人员对大型语言模型（LLMs）的推理能力进行了深入分析。他们首次系统地区分了归纳推理和演绎推理这两种能力，探讨了这两者对 AI 系统的挑战程度。

AI语音模型归纳推理演绎任务 AI语音技术 AI推理能力

2024-12-22 06:32:37 208人关注

Fish Audio发布Fish Agent V0.1 3B 实时语音克隆

近日，Fish Audio公司发布了全新的语音处理模型Fish Agent V0.13B，这款语音到语音模型能够高效、精确地生成和处理语音，尤其擅长模拟或克隆不同的声音。这意味着，我们距离拥有一个声音自然、反应迅速的AI语音助手又近了一步。

fish-audio fish-agent-v01-3b AI语音模型音频处理技术智能语音代理

2024-12-12 08:36:33 322人关注

开口跪！Fish Audio发布 Fish Speech 1.5 新增5种语言，还将上线实时无缝对话功能

Fish Audio最近丢出了一枚重磅炸弹——Fish Speech1.5，这款全新的语音合成模型简直是“声”临其境，不仅在准确性、稳定性和跨语言能力上狂甩前辈几条街，还一口气新增了五种语言支持!此外，Fish Speech1.5还即将推出实时无缝对话功能，让用户可以随时随地选择语音库进行交互式聊天。

鱼语1.5 实时对话多语言支持语音技术 AI语音模型

- 上云资讯 -

OpenAI免费开放ChatGPT高级语音聊天模式基于GPT-4o mini

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

ElevenLabs发布Turbo 2.5模型：速度提升3倍，覆盖中文等32种语言

上交大携手字节跳动推出LSLM：AI语音模型实现"边听边说"突破

Soul语音大模型重磅升级：实时端到端语音通话真人和AI虚拟人傻傻分不清楚！

研究发现，AI语音模型在归纳推理中表现出色，在演绎任务中“碰壁”

Fish Audio发布Fish Agent V0.1 3B 实时语音克隆

开口跪！Fish Audio发布 Fish Speech 1.5 新增5种语言，还将上线实时无缝对话功能

推荐阅读

上云服务

- 上云资讯 -

OpenAI免费开放ChatGPT高级语音聊天模式 基于GPT-4o mini

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

ElevenLabs发布Turbo 2.5模型：速度提升3倍，覆盖中文等32种语言

上交大携手字节跳动推出LSLM：AI语音模型实现"边听边说"突破

Soul语音大模型重磅升级：实时端到端语音通话 真人和AI虚拟人傻傻分不清楚！

研究发现，AI语音模型在归纳推理中表现出色，在演绎任务中“碰壁”

Fish Audio发布Fish Agent V0.1 3B 实时语音克隆

开口跪！Fish Audio发布 Fish Speech 1.5 新增5种语言，还将上线实时无缝对话功能

推荐阅读

上云服务

OpenAI免费开放ChatGPT高级语音聊天模式基于GPT-4o mini

Soul语音大模型重磅升级：实时端到端语音通话真人和AI虚拟人傻傻分不清楚！