LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-17 14:30:39 67人关注

ChatGPT录音模式面向Plus用户全面开放,已在macOS桌面应用上线

人工智能技术的快速发展正在持续改变我们的工作与生活方式。近日,OpenAI宣布其ChatGPT的录音模式(Record Mode)已向所有Plus用户全面推出,为用户提供更高效的语音交互体验。这一功能目前已在macOS桌面应用程序中上线,成为会议记录、头脑风暴和灵感捕捉的强大工具。

AI语音交互 OpenAI ChatGPT录音模式 ChatGPT Plus功能更新 AI会议记录工具 语音交互技术应用

2025-07-04 16:25:14 337人关注

开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!

近日,法国AI实验室Kyutai宣布,其全新文本转语音模型 Kyutai TTS 正式开源,为全球开发者与研究者带来了一款高性能、低延迟的语音合成解决方案。这一突破性发布不仅推动了开源AI技术的发展,也为多语言语音交互应用开辟了新的可能性。AIbase为您独家解析这一技术亮点及其潜在影响。

Kyutai TTS 文本转语音模型 开源语音合成 AI语音交互 多语言语音合成 AI开源技术

2025-02-16 10:24:39 101人关注

GPT-4o 级别!VITA-1.5:实时视觉与语音交互, 1.5秒互动延迟

近日,VITA-MLLM 团队宣布推出 VITA-1.5,这是该团队在 VITA-1.0基础上推出的升级版本,致力于提升多模态交互的实时性与准确性。VITA-1.5不仅支持英语和中文,还在多项性能指标上实现了显著提升,为用户提供了更流畅的交互体验。

GPT-4o VITA 1.5 实时视觉语音交互 多模态AI技术 AI语音交互技术 GPT-4o应用场景

2025-01-26 23:43:12 276人关注

YY直播发布AI伴播数字人“灵儿” 覆盖6000多个直播间

在YY2024年度巅峰盛典上,YY直播正式发布了其首个服务型AI伴播数字人“灵儿”,标志着YY直播24年AI技术应用成果的正式落地。该数字人“灵儿”是YY直播在人工智能领域的创新探索,旨在提升直播间互动与用户体验。

AI虚拟伴侣 AI陪伴应用 AI语音交互技术 AI情感陪伴机器人 AI虚拟助手应用场景

2025-01-16 23:16:43 219人关注

Qwen2-Audio:千问系列的音频多模态模型 无需文字即可语音交互

阿里云最新发布了一名为 Qwen-Audio 的大规模音频语言型,该模型可接受多种音频信号输入,够进行音频分析或直接回答语音指令极大地提升了语音交互体验。

Qwen2音频模型 多模态语音交互 大模型语音技术 AI语音交互系统 Qwen2应用场景

2025-01-12 09:28:34 172人关注

Figure公司发布超强实体ChatGPT机器人Figure 02 语音推理与视觉识别的完美结合

智能机器人领域的新秀Figure公司日前推出了其最新力作——Figure02机器人。这款集多项尖端技术于一身的智能机器人,不仅标志着AI技术的又一重大突破,更预示着人机交互即将迈入一个全新的时代。

ChatGPT机器人语音 机器人视觉技术 AI语音交互 AI视觉识别 ChatGPT多模态应用

2025-01-02 21:39:31 270人关注

ChatGPT 高级语音模式或将于9月24日全面上线

据科技媒体 testingcatalog 最新消息,ChatGPT 的高级语音模式可能将于9月24日正式发布,这一功能的全面推出无疑将为用户带来前所未有的交互体验。

ChatGPT高级语音模式 语音模式发布时间 9月24日更新 ChatGPT新功能 AI语音交互技术

2024-12-30 06:17:26 1116人关注

喜大普奔!ChatGPT高级语音功能已向所有免费用户开放

近日,OpenAI旗下ChatGPT的高级语音模式已悄然向免费用户开放了高级语音模式功能,并且在 iOS 和 Android 平台上全面推出。

ChatGPT语音功能 免费用户 语音聊天功能 ChatGPT新特性 AI语音交互

2024-12-19 12:31:38 53人关注

谷歌推出适用于iPhone的AI应用程序 并推出语音交互功能 Gemini Live

Google 正式在苹果 App Store 上线全新的 Gemini 应用,并推出语音交互功能 Gemini Live,这标志着智能语音助手领域的一次重大突破。与此同时,苹果计划将 OpenAI 的 ChatGPT 整合到 Siri 中的消息,也预示着这一领域的竞争正在加剧。

Google AI应用 iPhone语音交互 AI语音交互应用 Google与iPhone AI合作 AI应用新闻

2024-12-19 00:34:33 118人关注

​OpenAI宣布ChatGPT网页版全面上线高级语音模式 付费用户可用

OpenAI 宣布,将其 ChatGPT 的高级语音模式功能扩展至网页版本,用户可以直接在浏览器中与 AI 聊天机器人进行对话。

OpenAI ChatGPT Web版ChatGPT 高级语音模式 付费会员功能 AI语音交互

2024-12-16 14:42:15 93人关注

语音AI的颠覆者!PlayAI:用声音重塑数字交互的边界

从一个简单的Chrome扩展,到如今估值超2000万美元的AI语音帝国,PlayAI正用声音技术重新定义人机交互的想象边界。创始人Hammad Syed和Mahmoud Felfel用代码和算法编织出一个充满可能性的声音世界。

AI语音交互 PlayAI技术 数字交互创新 语音AI应用场景 PlayAI重新定义数字互动

2024-12-16 14:13:19 82人关注

Anthropic与Hume AI探索新型语音交互技术,重构人机界面未来

Anthropic与Hume AI近期推出了一项创新性的语音交互技术,旨在通过更自然、更具情感智能的方式实现人机交互。这一技术结合了Claude的自然语言处理能力和EVI2的情感识别功能,为数字助理交互模式提供了新的思路。

Anthropic Hume AI 语音交互技术 AI语音交互 Anthropic新闻 Hume AI应用

2024-12-12 14:41:27 93人关注

ElevenLabs推出全新对话式AI平台 助力智能语音代理快速构建

近日,人工智能领域的领先公司ElevenLabs宣布推出其全新对话式AI平台,使开发者能够在几分钟内构建高效、流畅的智能语音代理。该平台不仅具备低延迟、高可配置性和强大的可扩展性,还为用户提供了极大的灵活性和多样化的开发支持。

ElevenLabs 对话式AI平台 AI语音合成 AI语音技术 AI语音交互 AI语音应用

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10