上云资讯 - 来上云吧，企业上云一站式服务

2025-08-21 10:35:37 304人关注

谷歌 Gemini Live AI 助手全新功能上线，实时互动更智能

近日，谷歌宣布将推出一系列新功能，以增强其 AI 助手 Gemini Live 的互动体验。这些新功能将使用户能够与助手进行更自然和直观的实时对话，增强日常生活中的便利性。

Gemini Live 新功能 AI 助手互动体验谷歌 AI 助手升级实时对话 AI 智能助手便利性

2025-07-01 18:33:34 614人关注

TEN VAD震撼开源：企业级语音检测神器，打造超智能AI语音助手！

近日，TEN Agent团队宣布将其企业级实时语音活动检测器（TEN VAD）正式开源，这一突破性举措引发行业热议。TEN VAD以帧级精度的语音检测能力和优于WebRTC VAD及Silero VAD的性能表现，成为构建实时对话语音助手的强力引擎。

TEN VAD开源实时语音活动检测器帧级精度语音检测 WebRTC VAD对比 TEN VAD性能优势实时对话语音助手

2025-04-22 16:23:31 361人关注

语音AI“一步到位”！阶跃开源 130B 统治级语音模型，实时对话+情感克隆，炸裂来袭

语音交互领域迎来里程碑式突破!国内AI公司阶跃（Step Audio）近日震撼开源了一款 1300亿参数的超大型语音模型，引发业界高度关注。这款被誉为“统治级”的强大模型，是业界首个集语音理解与生成控制于一体的产品级开源实时语音对话系统，其功能的全面性和技术的先进性令人惊叹，预示着语音AI技术发展或将“一步到位”迈向新高度。

语音AI 实时情感克隆 AI语音技术情感克隆技术 130亿参数大模型

2025-01-28 02:17:26 265人关注

三星拟携手OpenAI研发智能电视：将支持实时对话及内容推荐

据国外媒体报道，三星电子正与OpenAI洽谈"开放伙伴关系"，计划将OpenAI的先进技术融入电视产品线，以提升其在全球电视市场的竞争优势。

Samsung Smart TV OpenAI 实时对话内容推荐系统 AI 大模型应用智能电视技术

2025-01-10 17:44:36 715人关注

谷歌Gemini全新语音聊天功能Gemini Live上线，让对话更自然流畅！

谷歌在最新的 Pixel9发布会上宣布推出了一项名为 Gemini Live 的语音聊天模式，这项功能将为 Gemini 的高级用户提供更为灵活的对话体验。Gemini Live 的工作原理与 ChatGPT 的语音聊天功能相似，用户可以在对话中选择多种声音进行交流，而且可以做到无缝的对话，甚至可以在对方讲话的同时进行打断，而无需轻触屏幕。

Google Gemini Live Voice Chat Google AI语音聊天 AI语音助手 Gemini实时对话 Google最新AI技术

2025-01-02 04:16:24 382人关注

Deepgram推出实时智能对话API，颠覆人机交互体验

Deepgram日前发布了一款革命性的AI语音代理API，为企业和开发者带来了前所未有的自然对话体验。这款API整合了先进的语音识别和合成技术，支持实时对话理解和生成，为构建高效语音助手开辟了新天地，尤其适用于客户支持和订单处理等场景。

Deepgram实时对话API 实时语音识别API Deepgram API应用场景语音转文本技术实时对话系统开发

2024-12-26 06:12:10 277人关注

Agora携手OpenAI推出实时对话AI SDK 打造超人性化语音助手

最近，Agora 公司宣布推出一款全新的实时对话 AI 软件开发工具包（SDK），并与 OpenAI 的实时 API 深度整合。这一举措旨在为对话 AI 开发者提供更强大的支持，让他们能够在不同的应用场景中实现更自然的互动体验。

Agora OpenAI 实时AI SDK AI 开发工具包实时音视频AI技术 AI SDK应用场景

2024-12-22 16:14:17 270人关注

全新开源音频模型Hertz-Dev:超低延迟，实现AI实时对话

在当今科技的浪潮中，对话式人工智能（AI）已经成为我们生活中的重要组成部分。然而，快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题，指的是输入与响应之间的时间差，常常让客服机器人和虚拟助手的体验变得缓慢，影响用户的使用感受。

开源音频模型实时AI对话超低延迟AI Hertz Dev 技术 AI音频处理技术

2024-12-19 23:33:24 287人关注

开源AI语言模型Ultravox v0.4.1：让AI实时对话更流畅、更智能

在人工智能的应用中，如何实现与 AI 的实时互动一直是开发者和研究人员面临的重大挑战。这其中，整合多模态信息（如文本、图像和音频）以形成一个连贯的对话系统显得尤为复杂。

OpenAI语言模型 Ultravox V0.4.1 AI大模型技术语言模型更新 AI新闻动态

2024-12-12 08:36:33 320人关注

开口跪！Fish Audio发布 Fish Speech 1.5 新增5种语言，还将上线实时无缝对话功能

Fish Audio最近丢出了一枚重磅炸弹——Fish Speech1.5，这款全新的语音合成模型简直是“声”临其境，不仅在准确性、稳定性和跨语言能力上狂甩前辈几条街，还一口气新增了五种语言支持!此外，Fish Speech1.5还即将推出实时无缝对话功能，让用户可以随时随地选择语音库进行交互式聊天。

鱼语1.5 实时对话多语言支持语音技术 AI语音模型

- 上云资讯 -

谷歌 Gemini Live AI 助手全新功能上线，实时互动更智能

TEN VAD震撼开源：企业级语音检测神器，打造超智能AI语音助手！

语音AI“一步到位”！阶跃开源 130B 统治级语音模型，实时对话+情感克隆，炸裂来袭

三星拟携手OpenAI研发智能电视：将支持实时对话及内容推荐

谷歌Gemini全新语音聊天功能Gemini Live上线，让对话更自然流畅！

Deepgram推出实时智能对话API，颠覆人机交互体验

Agora携手OpenAI推出实时对话AI SDK 打造超人性化语音助手

全新开源音频模型Hertz-Dev:超低延迟，实现AI实时对话

开源AI语言模型Ultravox v0.4.1：让AI实时对话更流畅、更智能

开口跪！Fish Audio发布 Fish Speech 1.5 新增5种语言，还将上线实时无缝对话功能

推荐阅读

上云服务

- 上云资讯 -

谷歌 Gemini Live AI 助手全新功能上线，实时互动更智能

TEN VAD震撼开源：企业级语音检测神器，打造超智能AI语音助手！

语音AI“一步到位”！阶跃开源 130B 统治级语音模型，实时对话+情感克隆，炸裂来袭

三星拟携手OpenAI研发智能电视：将支持实时对话及内容推荐

​谷歌Gemini全新语音聊天功能Gemini Live上线，让对话更自然流畅！

Deepgram推出实时智能对话API，颠覆人机交互体验

Agora携手OpenAI推出实时对话AI SDK 打造超人性化语音助手

全新开源音频模型Hertz-Dev:超低延迟，实现AI实时对话

开源AI语言模型Ultravox v0.4.1：让AI实时对话更流畅、更智能

开口跪！Fish Audio发布 Fish Speech 1.5 新增5种语言，还将上线实时无缝对话功能

推荐阅读

上云服务

谷歌Gemini全新语音聊天功能Gemini Live上线，让对话更自然流畅！