- 上云资讯 -
2025-07-01 18:33:34 115人关注
TEN VAD震撼开源:企业级语音检测神器,打造超智能AI语音助手!
近日,TEN Agent团队宣布将其企业级实时语音活动检测器(TEN VAD)正式开源,这一突破性举措引发行业热议。TEN VAD以帧级精度的语音检测能力和优于WebRTC VAD及Silero VAD的性能表现,成为构建实时对话语音助手的强力引擎。
TEN VAD开源 实时语音活动检测器 帧级精度语音检测 WebRTC VAD对比 TEN VAD性能优势 实时对话语音助手
2025-01-28 02:17:26 112人关注
三星拟携手OpenAI研发智能电视:将支持实时对话及内容推荐
据国外媒体报道,三星电子正与OpenAI洽谈"开放伙伴关系",计划将OpenAI的先进技术融入电视产品线,以提升其在全球电视市场的竞争优势。
2025-01-10 17:44:36 283人关注
谷歌Gemini全新语音聊天功能Gemini Live上线,让对话更自然流畅!
谷歌在最新的 Pixel9发布会上宣布推出了一项名为 Gemini Live 的语音聊天模式,这项功能将为 Gemini 的高级用户提供更为灵活的对话体验。Gemini Live 的工作原理与 ChatGPT 的语音聊天功能相似,用户可以在对话中选择多种声音进行交流,而且可以做到无缝的对话,甚至可以在对方讲话的同时进行打断,而无需轻触屏幕。
Google Gemini Live Voice Chat Google AI语音聊天 AI语音助手 Gemini实时对话 Google最新AI技术
2025-01-02 04:16:24 151人关注
Deepgram推出实时智能对话API,颠覆人机交互体验
Deepgram日前发布了一款革命性的AI语音代理API,为企业和开发者带来了前所未有的自然对话体验。这款API整合了先进的语音识别和合成技术,支持实时对话理解和生成,为构建高效语音助手开辟了新天地,尤其适用于客户支持和订单处理等场景。
2024-12-22 16:14:17 102人关注
全新开源音频模型Hertz-Dev:超低延迟,实现AI实时对话
在当今科技的浪潮中,对话式人工智能(AI)已经成为我们生活中的重要组成部分。然而,快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题,指的是输入与响应之间的时间差,常常让客服机器人和虚拟助手的体验变得缓慢,影响用户的使用感受。
2024-12-19 23:33:24 113人关注
开源AI语言模型Ultravox v0.4.1:让AI实时对话更流畅、更智能
在人工智能的应用中,如何实现与 AI 的实时互动一直是开发者和研究人员面临的重大挑战。这其中,整合多模态信息(如文本、图像和音频)以形成一个连贯的对话系统显得尤为复杂。