LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-30 11:35:24 204人关注

OpenAI放大招!GPT-Realtime语音模型上线,支持图像输入,AI交互要逆天了!

OpenAI正式推出其最新语音模型GPT-Realtime,这款多模态语音Agent模型以其强大的推理能力、图像输入支持以及优化的指令遵循功能引发行业热议。AIbase从最新信息中获悉,GPT-Realtime不仅在语音交互上实现突破,还通过集成图像输入、远程MCP和SIP电话呼叫等功能,为开发者提供更智能、更灵活的语音Agent解决方案。

GPT-Realtime语音模型 多模态语音Agent 语音交互技术 图像输入支持 远程MCP集成 SIP电话呼叫功能

2025-08-29 10:20:11 164人关注

OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通

OpenAI 正式发布了其面向生产环境的“实时 API”,标志着公司在语音交互技术领域迈出了重要一步。该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者,其核心组件是全新的 GPT-Realtime 模型。该模型能够直接生成和处理语音,无需传统的文本转换步骤,从而实现更快、更自然的对话。

OpenAI实时API GPT-Realtime模型 语音交互技术 语音助手开发 实时语音生成 客户支持语音AI

2025-07-17 14:30:39 115人关注

ChatGPT录音模式面向Plus用户全面开放,已在macOS桌面应用上线

人工智能技术的快速发展正在持续改变我们的工作与生活方式。近日,OpenAI宣布其ChatGPT的录音模式(Record Mode)已向所有Plus用户全面推出,为用户提供更高效的语音交互体验。这一功能目前已在macOS桌面应用程序中上线,成为会议记录、头脑风暴和灵感捕捉的强大工具。

AI语音交互 OpenAI ChatGPT录音模式 ChatGPT Plus功能更新 AI会议记录工具 语音交互技术应用

2025-07-16 18:13:29 105人关注

Willow智能语音输入法获420万美元天使轮融资,剑指语音操作系统新未来

人工智能技术的快速发展正推动语音交互领域迈向新高度。近日,智能语音输入法初创公司Willow宣布成功完成420万美元天使轮融资,引发业界广泛关注。据网络社交媒体信息显示,Willow旨在通过其创新的语音交互技术,打造基于语音的操作系统,彻底改变人机交互方式。

智能语音输入法 语音交互技术 人机交互方式创新 Willow语音操作系统 语音技术初创公司融资

2025-02-21 18:43:11 207人关注

罗永浩新 AI 助理 “J1 Assistant” 正式上线,语音交互引领智能新时代

近日,罗永浩旗下的人工智能初创项目 Jarvis 悄然上线了一款名为 “J1Assistant” 的 AI 助理软件,目前该软件仅在海外提供安卓版本,官网访问限制了国内用户的 IP 地址。J1Assistant 的推出标志着罗永浩在人工智能领域的新一次尝试,期待能在这个竞争激烈的市场中找到一席之地。

罗永浩AI助手 J1语音交互 AI语音助手 智能语音交互技术 AI助手应用场景

2025-02-16 10:24:39 131人关注

GPT-4o 级别!VITA-1.5:实时视觉与语音交互, 1.5秒互动延迟

近日,VITA-MLLM 团队宣布推出 VITA-1.5,这是该团队在 VITA-1.0基础上推出的升级版本,致力于提升多模态交互的实时性与准确性。VITA-1.5不仅支持英语和中文,还在多项性能指标上实现了显著提升,为用户提供了更流畅的交互体验。

GPT-4o VITA 1.5 实时视觉语音交互 多模态AI技术 AI语音交互技术 GPT-4o应用场景

2025-01-26 23:43:12 336人关注

YY直播发布AI伴播数字人“灵儿” 覆盖6000多个直播间

在YY2024年度巅峰盛典上,YY直播正式发布了其首个服务型AI伴播数字人“灵儿”,标志着YY直播24年AI技术应用成果的正式落地。该数字人“灵儿”是YY直播在人工智能领域的创新探索,旨在提升直播间互动与用户体验。

AI虚拟伴侣 AI陪伴应用 AI语音交互技术 AI情感陪伴机器人 AI虚拟助手应用场景

2025-01-10 17:34:11 181人关注

对标GPT-4o!谷歌携Gemini Live登场 支持摄像头和声音对话

数字助手已经成为我们生活中的重要伙伴,而谷歌的Gemini Live的推出,将这种便捷性提升到了新的高度。借助生成式AI的力量,Gemini Live不仅能够理解我们的需求,还能以更自然、更人性化的方式与我们进行互动。

Google Gemini Live 相机语音聊天 Google Gemini 功能 AI 相机应用 语音交互技术

2025-01-02 21:39:31 317人关注

ChatGPT 高级语音模式或将于9月24日全面上线

据科技媒体 testingcatalog 最新消息,ChatGPT 的高级语音模式可能将于9月24日正式发布,这一功能的全面推出无疑将为用户带来前所未有的交互体验。

ChatGPT高级语音模式 语音模式发布时间 9月24日更新 ChatGPT新功能 AI语音交互技术

2024-12-25 21:29:17 110人关注

ChatGPT 高级语音模式登陆欧洲! 新增五种语音和自定义指令功能

OpenAI 近日宣布,将其 ChatGPT 高级语音模式扩展到欧盟、瑞士、冰岛、挪威和列支敦士登等地区。该功能允许 ChatGPT 在232毫秒(平均320毫秒)内响应音频输入,可与人类在典型对话中的响应时间相媲美。

ChatGPT高级语音模式 欧洲市场ChatGPT功能 ChatGPT自定义指令 ChatGPT语音交互技术 ChatGPT欧洲用户定制

2024-12-16 14:13:19 108人关注

Anthropic与Hume AI探索新型语音交互技术,重构人机界面未来

Anthropic与Hume AI近期推出了一项创新性的语音交互技术,旨在通过更自然、更具情感智能的方式实现人机交互。这一技术结合了Claude的自然语言处理能力和EVI2的情感识别功能,为数字助理交互模式提供了新的思路。

Anthropic Hume AI 语音交互技术 AI语音交互 Anthropic新闻 Hume AI应用

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10