上云资讯 - 来上云吧，企业上云一站式服务

2025-12-17 12:26:28 150人关注

谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

谷歌最近发布了 Gemini2.5Flash Native Audio 的更新，显著增强了其语音助手的功能。这一版本旨在更好地处理复杂的工作流程，提高执行用户指令的准确性，同时使对话更加自然流畅。根据谷歌的反馈，新版本在开发者指令的遵循率上从84% 提升至90%，这表明语音助手在理解和执行用户请求方面有了显著进步。

AI

2025-11-08 13:39:16 129人关注

谷歌地图迎来重磅升级！语音助手Gemini助你轻松导航

近日，谷歌宣布，其地图应用将整合最新的生成式人工智能聊天机器人 ——Gemini。这个全新的语音助手功能将极大提升用户的导航体验，使得在谷歌地图上查找地点变得更加便捷。

AI

2025-11-06 11:32:24 137人关注

苹果豪掷10亿美元牵手谷歌！新Siri明年春季上线，Gemini大模型驱动语音助手重生

沉寂多年的Siri即将迎来史诗级升级。据可靠消息，苹果公司已与谷歌达成重磅合作，每年支付约10亿美元，获得定制版Gemini大模型的独家使用权，并计划于2026年春季随iOS26.4正式推送全新Siri。此举标志着苹果在自研大模型进展不及预期的背景下，果断选择借力外部顶尖技术，以重夺智能语音交互的主导权。

AI

2025-08-29 10:37:16 506人关注

OpenAI 发布全新语音模型 GPT-Realtime，专为语音AI Agent设计

OpenAI 在凌晨1点举行了技术直播，正式发布了其全新的语音模型 ——GPT-Realtime。这一多模态模型专为语音 AI Agent 设计，旨在生成更加自然流畅的语音，能够模仿人类丰富多样的语调、情感和语速。GPT-Realtime 的应用场景广泛，涵盖了客服、教育、金融和医疗等多个领域，为打造智能语音助手提供了强大的支持。

GPT-Realtime OpenAI 语音模型多模态语音AI Agent 语音助手技术自然语音生成智能客服应用

2025-08-29 10:20:11 391人关注

OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通

OpenAI 正式发布了其面向生产环境的“实时 API”，标志着公司在语音交互技术领域迈出了重要一步。该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者，其核心组件是全新的 GPT-Realtime 模型。该模型能够直接生成和处理语音，无需传统的文本转换步骤，从而实现更快、更自然的对话。

OpenAI实时API GPT-Realtime模型语音交互技术语音助手开发实时语音生成客户支持语音AI

2025-08-23 09:33:28 410人关注

特斯拉语音助手接入火山引擎与DeepSeek大模型智能座舱体验全面升级

AIbase报道特斯拉正为其车辆语音助手功能引入更强AI能力。根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》，官方首次明确其语音助手将接入外部大模型技术，合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。

特斯拉AI语音助手升级火山引擎大模型 DeepSeek AI技术特斯拉语音助手合作伙伴车机语音AI技术应用

2025-08-22 16:10:37 376人关注

特斯拉升级语音助手，AI能力再上新台阶

8月21日，特斯拉在其车辆的语音助手功能上进行了一次重要升级，计划引入更强大的人工智能技术。根据最新更新的《特斯拉车机语音助手使用条款》，特斯拉首次确认其语音助手将整合外部大模型技术，合作伙伴包括字节跳动旗下的火山引擎和人工智能公司 DeepSeek。

特斯拉语音助手升级特斯拉AI大模型特斯拉语音助手合作伙伴特斯拉与火山引擎合作特斯拉与DeepSeek合作特斯拉语音助手使用条款

2025-07-31 09:22:20 312人关注

Spotify 计划通过 AI 技术实现更具互动性的语音助手

在最近的财报电话会议上，Spotify 的首席产品和技术官古斯塔夫・索德斯特伦（Gustav Söderström）透露，随着人工智能技术的发展，未来 Spotify 的用户体验将变得更加 “互动”。他提到，Spotify 正在探索如何利用生成式 AI 来实现一个更具对话性的语音界面，用户可以更自然地与平台进行互动。

Spotify AI技术生成式AI语音界面 Spotify用户体验优化互动式音乐平台 AI驱动的音乐服务

2025-07-05 14:42:17 297人关注

Gemini Live 即将全面整合 Google 应用，AI 助手更聪明了！

谷歌的智能语音助手 Gemini Live 正迎来重大升级。根据近期网络上的最新信息，Gemini Live 即将实现与多种 Google 应用的深度整合，进一步提升其在日常生活中的实用性和智能化水平。这一更新将使 Gemini Live 成为更强大的生产力工具，满足用户多样化的需求。以下是 AIbase 对这一动态的整理与分析。

谷歌语音助手 Gemini Live 升级 Gemini Live 深度整合 Google 应用整合智能语音助手生产力工具

2025-07-01 18:33:34 614人关注

TEN VAD震撼开源：企业级语音检测神器，打造超智能AI语音助手！

近日，TEN Agent团队宣布将其企业级实时语音活动检测器（TEN VAD）正式开源，这一突破性举措引发行业热议。TEN VAD以帧级精度的语音检测能力和优于WebRTC VAD及Silero VAD的性能表现，成为构建实时对话语音助手的强力引擎。

TEN VAD开源实时语音活动检测器帧级精度语音检测 WebRTC VAD对比 TEN VAD性能优势实时对话语音助手

2025-06-10 16:36:21 526人关注

马斯克宣布新版 Grok 应用上线：语音模式体验大幅提升

埃隆·马斯克今日在社交平台 X 上发文，宣布其人工智能公司 xAI 的新版本 Grok 应用正式上线。这一消息迅速引发科技爱好者和 X 用户的广泛关注。马斯克特别推荐用户体验全新升级的 Grok 语音模式，称其交互能力显著提升，为用户带来更自然、更智能的对话体验。

Elon Musk Grok app voice mode AI语音助手新闻发布

2025-06-06 16:28:33 216人关注

Anthropic在移动端推Claude对话语音模式，可搜索Google 文档、日历等

位于旧金山的人工智能初创公司Anthropic宣布推出 Claude 人工智能聊天机器人新的重大更新:全新的语音对话模式。该功能已在苹果 App Store（iOS 设备）和谷歌 Play Store(Android 设备)的移动应用中上线。

Anthropic Claude Voice功能 Mobile应用 Google Docs集成 AI语音助手

2025-06-06 16:20:27 793人关注

瑞幸咖啡接入豆包大模型支持语音下单等功能

5月26日，瑞幸咖啡在官方APP和微信小程序正式推出首个AI智能体（1.0版），此智能体由瑞幸咖啡与火山引擎携手打造，借助豆包大模型技术，为用户带来语音下单、个性化推荐等便捷功能，引领咖啡消费进入全新智能化时代。

瑞幸咖啡 AI语音点单 AI点单系统智能语音助手咖啡行业数字化转型

2025-06-04 16:41:27 325人关注

颠覆操作习惯！Raycast 推出 AI 神器：动动嘴就能操控电脑上的一切！

厌倦了在各种应用之间来回切换的繁琐操作?受够了被各种复杂指令和界面支配的“人机交互”? 效率神器 Raycast 再次放大招了!他们最新推出的 AI Extensions 功能，简直要彻底颠覆你与电脑的交互方式—— 现在，你只需动动嘴皮子，就能像指挥私人助理一样，操控电脑上的一切应用!

Raycast AI 语音控制电脑 AI语音助手 Raycast AI功能电脑语音控制技巧

2025-06-02 18:38:11 195人关注

亚马逊推出全新智能助手 Alexa+，语音指令执行餐馆预订等任务

亚马逊宣布推出全新的智能助手 Alexa+，这一升级版的数字助理引入了生成式人工智能技术，提升了对话的自然流畅度和智能化水平。Alexa + 不仅能记住用户的偏好，还具备强大的多平台操作能力，让用户的日常任务更加轻松便捷。

Amazon Alexa 语音助手餐厅预订 Alexa Plus功能智能语音技术

2025-05-11 10:37:35 569人关注

天猫精灵Q糖智能音箱亮相：升级AI功能，新增红外遥控

在智能家居日益普及的今天，天猫精灵又推出了其最新的 Q 糖系列智能音箱。这一系列音箱不仅外观时尚，还配备了强大的智能功能，旨在为用户提供更便捷的生活体验。5月9日，天猫精灵 Q 糖系列正式上市，分为红外版与标准版两种选择。

天猫精灵Q糖智能音箱天猫精灵新品智能语音助手智能家居设备

2025-05-09 16:29:44 264人关注

渥太华医院引入 AI 语音助手，医生工作负担减轻 70%

近年来，医疗行业面临着医生工作负担过重与患者就医难的双重挑战。为了应对这一问题，加拿大渥太华医院（TOH）于去年引入了微软的 DAX Co pilot，取得了显著成效。最新数据显示，该系统不仅节省了每位医生每次就诊约七分钟，还将医生报告的倦怠和疲劳降低了70%。同时，93% 的患者反馈他们的就医体验得到了提升。

AI语音助手医疗AI应用医生AI助手医院AI技术渥太华医院AI项目

2025-05-06 16:41:44 342人关注

Claude 移动应用即将推出语音模式，支持多种声音选项

Anthropic 的 Claude 移动应用即将迎来一次重要升级，新增的语音模式功能备受期待。据 TestingCatalog 周日的报道，Claude 的语音模式将采用推按式对话方式，并且支持多种声音选项。

Claude移动应用 Claude语音模式 AI语音助手 Claude app功能移动端AI应用

2025-02-28 10:43:44 315人关注

Alexa 全面升级，正式接入大模型，挑战AI助手新格局

日前，亚马逊宣布其语音助手 Alexa 正式接入大模型，推出了名为 Alexa + 的新版功能。这一更新使 Alexa 不仅仅是一款智能音箱，更向智能助手的多元化发展迈出了重要一步。

Alexa升级 AI助手新时代智能语音助手 Alexa新功能 AI技术发展

2025-02-26 16:41:19 764人关注

荣耀YOYO助理2.0接入Deepseek：更高效更稳定

今天下午，荣耀举行了一场新品发布会，正式推出了YOYO助理的最新版本——YOYO助理2.0。此次升级，YOYO助理在智能体、适用面以及交互方式上均实现了显著提升，为用户带来了更加智能和开放的体验。

荣耀YOYO助手2 DeepSeek AI助手技术智能语音助手大模型应用

- 上云资讯 -

谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

谷歌地图迎来重磅升级！语音助手Gemini助你轻松导航

苹果豪掷10亿美元牵手谷歌！新Siri明年春季上线，Gemini大模型驱动语音助手重生

OpenAI 发布全新语音模型 GPT-Realtime，专为语音AI Agent设计

OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通

特斯拉语音助手接入火山引擎与DeepSeek大模型智能座舱体验全面升级

特斯拉升级语音助手，AI能力再上新台阶

Spotify 计划通过 AI 技术实现更具互动性的语音助手

Gemini Live 即将全面整合 Google 应用，AI 助手更聪明了！

TEN VAD震撼开源：企业级语音检测神器，打造超智能AI语音助手！

马斯克宣布新版 Grok 应用上线：语音模式体验大幅提升

Anthropic在移动端推Claude对话语音模式，可搜索Google 文档、日历等

瑞幸咖啡接入豆包大模型支持语音下单等功能

颠覆操作习惯！Raycast 推出 AI 神器：动动嘴就能操控电脑上的一切！

亚马逊推出全新智能助手 Alexa+，语音指令执行餐馆预订等任务

天猫精灵Q糖智能音箱亮相：升级AI功能，新增红外遥控

渥太华医院引入 AI 语音助手，医生工作负担减轻 70%

Claude 移动应用即将推出语音模式，支持多种声音选项

Alexa 全面升级，正式接入大模型，挑战AI助手新格局

荣耀YOYO助理2.0接入Deepseek：更高效更稳定

推荐阅读

上云服务

- 上云资讯 -

​谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

谷歌地图迎来重磅升级！语音助手Gemini助你轻松导航

苹果豪掷10亿美元牵手谷歌！新Siri明年春季上线，Gemini大模型驱动语音助手重生

OpenAI 发布全新语音模型 GPT-Realtime，专为语音AI Agent设计

OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通

特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级

特斯拉升级语音助手，AI能力再上新台阶

Spotify 计划通过 AI 技术实现更具互动性的语音助手

Gemini Live 即将全面整合 Google 应用，AI 助手更聪明了！

TEN VAD震撼开源：企业级语音检测神器，打造超智能AI语音助手！

马斯克宣布新版 Grok 应用上线：语音模式体验大幅提升

Anthropic在移动端推Claude对话语音模式，可搜索Google 文档、日历等

瑞幸咖啡接入豆包大模型 支持语音下单等功能

颠覆操作习惯！Raycast 推出 AI 神器：动动嘴就能操控电脑上的一切！

​亚马逊推出全新智能助手 Alexa+，语音指令执行餐馆预订等任务

天猫精灵Q糖智能音箱亮相：升级AI功能，新增红外遥控

渥太华医院引入 AI 语音助手，医生工作负担减轻 70%

Claude 移动应用即将推出语音模式，支持多种声音选项

Alexa 全面升级，正式接入大模型，挑战AI助手新格局

荣耀YOYO助理2.0接入Deepseek：更高效 更稳定

推荐阅读

上云服务

谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现

特斯拉语音助手接入火山引擎与DeepSeek大模型智能座舱体验全面升级

瑞幸咖啡接入豆包大模型支持语音下单等功能

亚马逊推出全新智能助手 Alexa+，语音指令执行餐馆预订等任务

荣耀YOYO助理2.0接入Deepseek：更高效更稳定