- 上云资讯 -
2025-08-29 10:37:16 249人关注
OpenAI 发布全新语音模型 GPT-Realtime,专为语音AI Agent设计
OpenAI 在凌晨1点举行了技术直播,正式发布了其全新的语音模型 ——GPT-Realtime。这一多模态模型专为语音 AI Agent 设计,旨在生成更加自然流畅的语音,能够模仿人类丰富多样的语调、情感和语速。GPT-Realtime 的应用场景广泛,涵盖了客服、教育、金融和医疗等多个领域,为打造智能语音助手提供了强大的支持。
2025-08-29 10:20:11 164人关注
OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通
OpenAI 正式发布了其面向生产环境的“实时 API”,标志着公司在语音交互技术领域迈出了重要一步。该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者,其核心组件是全新的 GPT-Realtime 模型。该模型能够直接生成和处理语音,无需传统的文本转换步骤,从而实现更快、更自然的对话。
2025-08-23 09:33:28 168人关注
特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级
AIbase报道 特斯拉正为其车辆语音助手功能引入更强AI能力。根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。
2025-08-22 16:10:37 111人关注
特斯拉升级语音助手,AI能力再上新台阶
8月21日,特斯拉在其车辆的语音助手功能上进行了一次重要升级,计划引入更强大的人工智能技术。根据最新更新的《特斯拉车机语音助手使用条款》,特斯拉首次确认其语音助手将整合外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司 DeepSeek。
特斯拉语音助手升级 特斯拉AI大模型 特斯拉语音助手合作伙伴 特斯拉与火山引擎合作 特斯拉与DeepSeek合作 特斯拉语音助手使用条款
2025-07-31 09:22:20 58人关注
Spotify 计划通过 AI 技术实现更具互动性的语音助手
在最近的财报电话会议上,Spotify 的首席产品和技术官古斯塔夫・索德斯特伦(Gustav Söderström)透露,随着人工智能技术的发展,未来 Spotify 的用户体验将变得更加 “互动”。他提到,Spotify 正在探索如何利用生成式 AI 来实现一个更具对话性的语音界面,用户可以更自然地与平台进行互动。
2025-07-05 14:42:17 99人关注
Gemini Live 即将全面整合 Google 应用,AI 助手更聪明了!
谷歌的智能语音助手 Gemini Live 正迎来重大升级。根据近期网络上的最新信息,Gemini Live 即将实现与多种 Google 应用的深度整合,进一步提升其在日常生活中的实用性和智能化水平。这一更新将使 Gemini Live 成为更强大的生产力工具,满足用户多样化的需求。以下是 AIbase 对这一动态的整理与分析。
谷歌语音助手 Gemini Live 升级 Gemini Live 深度整合 Google 应用整合 智能语音助手生产力工具
2025-07-01 18:33:34 243人关注
TEN VAD震撼开源:企业级语音检测神器,打造超智能AI语音助手!
近日,TEN Agent团队宣布将其企业级实时语音活动检测器(TEN VAD)正式开源,这一突破性举措引发行业热议。TEN VAD以帧级精度的语音检测能力和优于WebRTC VAD及Silero VAD的性能表现,成为构建实时对话语音助手的强力引擎。
TEN VAD开源 实时语音活动检测器 帧级精度语音检测 WebRTC VAD对比 TEN VAD性能优势 实时对话语音助手
2025-06-10 16:36:21 186人关注
马斯克宣布新版 Grok 应用上线:语音模式体验大幅提升
埃隆·马斯克今日在社交平台 X 上发文,宣布其人工智能公司 xAI 的新版本 Grok 应用正式上线。这一消息迅速引发科技爱好者和 X 用户的广泛关注。马斯克特别推荐用户体验全新升级的 Grok 语音模式,称其交互能力显著提升,为用户带来更自然、更智能的对话体验。
2025-06-06 16:28:33 96人关注
Anthropic在移动端推Claude对话语音模式,可搜索Google 文档、日历等
位于旧金山的人工智能初创公司Anthropic宣布推出 Claude 人工智能聊天机器人新的重大更新:全新的语音对话模式。该功能已在苹果 App Store(iOS 设备)和谷歌 Play Store(Android 设备)的移动应用中上线。
2025-06-04 16:41:27 112人关注
颠覆操作习惯!Raycast 推出 AI 神器:动动嘴就能操控电脑上的一切!
厌倦了在各种应用之间来回切换的繁琐操作?受够了被各种复杂指令和界面支配的“人机交互”? 效率神器 Raycast 再次放大招了!他们最新推出的 AI Extensions 功能,简直要彻底颠覆你与电脑的交互方式—— 现在,你只需动动嘴皮子,就能像指挥私人助理一样,操控电脑上的一切应用!
2025-06-02 18:38:11 63人关注
亚马逊推出全新智能助手 Alexa+,语音指令执行餐馆预订等任务
亚马逊宣布推出全新的智能助手 Alexa+,这一升级版的数字助理引入了生成式人工智能技术,提升了对话的自然流畅度和智能化水平。Alexa + 不仅能记住用户的偏好,还具备强大的多平台操作能力,让用户的日常任务更加轻松便捷。
2025-05-06 16:41:44 126人关注
Claude 移动应用即将推出语音模式,支持多种声音选项
Anthropic 的 Claude 移动应用即将迎来一次重要升级,新增的语音模式功能备受期待。据 TestingCatalog 周日的报道,Claude 的语音模式将采用推按式对话方式,并且支持多种声音选项。
2025-02-23 16:33:25 273人关注
马斯克: Grok 3 语音模式早期测试版已上线
2月20日,马斯克通过社交平台X发布了一条重要消息,宣布Grok应用程序已成功上线了Grok3语音模式的早期测试版。这一动态立即引起了广泛关注。
2025-02-12 16:35:39 501人关注
海信电视接入 DeepSeek,AI 语音对话功能升级
海信集团正式宣布,旗下自研的星海大模型成功接入了 DeepSeek。这一举措旨在为用户在智慧生活和智慧城市领域带来更加便捷和智能的交互体验。海信自2024年起投入研发的星海大模型,涵盖了语言、视觉生成和多模态理解三大领域。通过与 DeepSeek 的融合,海信的智能技术能力得到了显著提升。