- 上云资讯 -
2025-12-17 12:26:28 28人关注
谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现
谷歌最近发布了 Gemini2.5Flash Native Audio 的更新,显著增强了其语音助手的功能。这一版本旨在更好地处理复杂的工作流程,提高执行用户指令的准确性,同时使对话更加自然流畅。根据谷歌的反馈,新版本在开发者指令的遵循率上从84% 提升至90%,这表明语音助手在理解和执行用户请求方面有了显著进步。
2025-11-08 13:39:16 67人关注
谷歌地图迎来重磅升级!语音助手Gemini助你轻松导航
近日,谷歌宣布,其地图应用将整合最新的生成式人工智能聊天机器人 ——Gemini。这个全新的语音助手功能将极大提升用户的导航体验,使得在谷歌地图上查找地点变得更加便捷。
2025-11-06 11:32:24 77人关注
苹果豪掷10亿美元牵手谷歌!新Siri明年春季上线,Gemini大模型驱动语音助手重生
沉寂多年的Siri即将迎来史诗级升级。据可靠消息,苹果公司已与谷歌达成重磅合作,每年支付约10亿美元,获得定制版Gemini大模型的独家使用权,并计划于2026年春季随iOS26.4正式推送全新Siri。此举标志着苹果在自研大模型进展不及预期的背景下,果断选择借力外部顶尖技术,以重夺智能语音交互的主导权。
2025-08-29 10:37:16 387人关注
OpenAI 发布全新语音模型 GPT-Realtime,专为语音AI Agent设计
OpenAI 在凌晨1点举行了技术直播,正式发布了其全新的语音模型 ——GPT-Realtime。这一多模态模型专为语音 AI Agent 设计,旨在生成更加自然流畅的语音,能够模仿人类丰富多样的语调、情感和语速。GPT-Realtime 的应用场景广泛,涵盖了客服、教育、金融和医疗等多个领域,为打造智能语音助手提供了强大的支持。
2025-08-29 10:20:11 278人关注
OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通
OpenAI 正式发布了其面向生产环境的“实时 API”,标志着公司在语音交互技术领域迈出了重要一步。该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者,其核心组件是全新的 GPT-Realtime 模型。该模型能够直接生成和处理语音,无需传统的文本转换步骤,从而实现更快、更自然的对话。
2025-08-23 09:33:28 273人关注
特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级
AIbase报道 特斯拉正为其车辆语音助手功能引入更强AI能力。根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。
2025-08-22 16:10:37 228人关注
特斯拉升级语音助手,AI能力再上新台阶
8月21日,特斯拉在其车辆的语音助手功能上进行了一次重要升级,计划引入更强大的人工智能技术。根据最新更新的《特斯拉车机语音助手使用条款》,特斯拉首次确认其语音助手将整合外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司 DeepSeek。
特斯拉语音助手升级 特斯拉AI大模型 特斯拉语音助手合作伙伴 特斯拉与火山引擎合作 特斯拉与DeepSeek合作 特斯拉语音助手使用条款
2025-07-31 09:22:20 251人关注
Spotify 计划通过 AI 技术实现更具互动性的语音助手
在最近的财报电话会议上,Spotify 的首席产品和技术官古斯塔夫・索德斯特伦(Gustav Söderström)透露,随着人工智能技术的发展,未来 Spotify 的用户体验将变得更加 “互动”。他提到,Spotify 正在探索如何利用生成式 AI 来实现一个更具对话性的语音界面,用户可以更自然地与平台进行互动。
2025-07-05 14:42:17 191人关注
Gemini Live 即将全面整合 Google 应用,AI 助手更聪明了!
谷歌的智能语音助手 Gemini Live 正迎来重大升级。根据近期网络上的最新信息,Gemini Live 即将实现与多种 Google 应用的深度整合,进一步提升其在日常生活中的实用性和智能化水平。这一更新将使 Gemini Live 成为更强大的生产力工具,满足用户多样化的需求。以下是 AIbase 对这一动态的整理与分析。
谷歌语音助手 Gemini Live 升级 Gemini Live 深度整合 Google 应用整合 智能语音助手生产力工具
2025-07-01 18:33:34 467人关注
TEN VAD震撼开源:企业级语音检测神器,打造超智能AI语音助手!
近日,TEN Agent团队宣布将其企业级实时语音活动检测器(TEN VAD)正式开源,这一突破性举措引发行业热议。TEN VAD以帧级精度的语音检测能力和优于WebRTC VAD及Silero VAD的性能表现,成为构建实时对话语音助手的强力引擎。
TEN VAD开源 实时语音活动检测器 帧级精度语音检测 WebRTC VAD对比 TEN VAD性能优势 实时对话语音助手
2025-06-10 16:36:21 322人关注
马斯克宣布新版 Grok 应用上线:语音模式体验大幅提升
埃隆·马斯克今日在社交平台 X 上发文,宣布其人工智能公司 xAI 的新版本 Grok 应用正式上线。这一消息迅速引发科技爱好者和 X 用户的广泛关注。马斯克特别推荐用户体验全新升级的 Grok 语音模式,称其交互能力显著提升,为用户带来更自然、更智能的对话体验。
2025-06-06 16:28:33 160人关注
Anthropic在移动端推Claude对话语音模式,可搜索Google 文档、日历等
位于旧金山的人工智能初创公司Anthropic宣布推出 Claude 人工智能聊天机器人新的重大更新:全新的语音对话模式。该功能已在苹果 App Store(iOS 设备)和谷歌 Play Store(Android 设备)的移动应用中上线。
2025-06-04 16:41:27 204人关注
颠覆操作习惯!Raycast 推出 AI 神器:动动嘴就能操控电脑上的一切!
厌倦了在各种应用之间来回切换的繁琐操作?受够了被各种复杂指令和界面支配的“人机交互”? 效率神器 Raycast 再次放大招了!他们最新推出的 AI Extensions 功能,简直要彻底颠覆你与电脑的交互方式—— 现在,你只需动动嘴皮子,就能像指挥私人助理一样,操控电脑上的一切应用!
2025-06-02 18:38:11 121人关注
亚马逊推出全新智能助手 Alexa+,语音指令执行餐馆预订等任务
亚马逊宣布推出全新的智能助手 Alexa+,这一升级版的数字助理引入了生成式人工智能技术,提升了对话的自然流畅度和智能化水平。Alexa + 不仅能记住用户的偏好,还具备强大的多平台操作能力,让用户的日常任务更加轻松便捷。
2025-05-06 16:41:44 220人关注
Claude 移动应用即将推出语音模式,支持多种声音选项
Anthropic 的 Claude 移动应用即将迎来一次重要升级,新增的语音模式功能备受期待。据 TestingCatalog 周日的报道,Claude 的语音模式将采用推按式对话方式,并且支持多种声音选项。
