- 上云资讯 -
2025-08-30 11:35:24 204人关注
OpenAI放大招!GPT-Realtime语音模型上线,支持图像输入,AI交互要逆天了!
OpenAI正式推出其最新语音模型GPT-Realtime,这款多模态语音Agent模型以其强大的推理能力、图像输入支持以及优化的指令遵循功能引发行业热议。AIbase从最新信息中获悉,GPT-Realtime不仅在语音交互上实现突破,还通过集成图像输入、远程MCP和SIP电话呼叫等功能,为开发者提供更智能、更灵活的语音Agent解决方案。
2025-08-29 10:20:11 164人关注
OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通
OpenAI 正式发布了其面向生产环境的“实时 API”,标志着公司在语音交互技术领域迈出了重要一步。该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者,其核心组件是全新的 GPT-Realtime 模型。该模型能够直接生成和处理语音,无需传统的文本转换步骤,从而实现更快、更自然的对话。
2025-07-17 14:30:39 115人关注
ChatGPT录音模式面向Plus用户全面开放,已在macOS桌面应用上线
人工智能技术的快速发展正在持续改变我们的工作与生活方式。近日,OpenAI宣布其ChatGPT的录音模式(Record Mode)已向所有Plus用户全面推出,为用户提供更高效的语音交互体验。这一功能目前已在macOS桌面应用程序中上线,成为会议记录、头脑风暴和灵感捕捉的强大工具。
AI语音交互 OpenAI ChatGPT录音模式 ChatGPT Plus功能更新 AI会议记录工具 语音交互技术应用
2025-07-16 18:13:29 105人关注
Willow智能语音输入法获420万美元天使轮融资,剑指语音操作系统新未来
人工智能技术的快速发展正推动语音交互领域迈向新高度。近日,智能语音输入法初创公司Willow宣布成功完成420万美元天使轮融资,引发业界广泛关注。据网络社交媒体信息显示,Willow旨在通过其创新的语音交互技术,打造基于语音的操作系统,彻底改变人机交互方式。
2025-01-26 23:43:12 336人关注
YY直播发布AI伴播数字人“灵儿” 覆盖6000多个直播间
在YY2024年度巅峰盛典上,YY直播正式发布了其首个服务型AI伴播数字人“灵儿”,标志着YY直播24年AI技术应用成果的正式落地。该数字人“灵儿”是YY直播在人工智能领域的创新探索,旨在提升直播间互动与用户体验。
2025-01-10 17:34:11 181人关注
对标GPT-4o!谷歌携Gemini Live登场 支持摄像头和声音对话
数字助手已经成为我们生活中的重要伙伴,而谷歌的Gemini Live的推出,将这种便捷性提升到了新的高度。借助生成式AI的力量,Gemini Live不仅能够理解我们的需求,还能以更自然、更人性化的方式与我们进行互动。
2025-01-02 21:39:31 317人关注
ChatGPT 高级语音模式或将于9月24日全面上线
据科技媒体 testingcatalog 最新消息,ChatGPT 的高级语音模式可能将于9月24日正式发布,这一功能的全面推出无疑将为用户带来前所未有的交互体验。
2024-12-25 21:29:17 110人关注
ChatGPT 高级语音模式登陆欧洲! 新增五种语音和自定义指令功能
OpenAI 近日宣布,将其 ChatGPT 高级语音模式扩展到欧盟、瑞士、冰岛、挪威和列支敦士登等地区。该功能允许 ChatGPT 在232毫秒(平均320毫秒)内响应音频输入,可与人类在典型对话中的响应时间相媲美。
ChatGPT高级语音模式 欧洲市场ChatGPT功能 ChatGPT自定义指令 ChatGPT语音交互技术 ChatGPT欧洲用户定制