上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-01-23 20:18:34 546人关注

AI终于迈过这道槛！Livekit 开源模型精准识别“你是否说完”！

在人机对话的世界里，最让人头疼的莫过于——“你到底说完没”! 这句话看似简单，却成了无数语音助手和客服机器人迈不过去的一道坎儿。你是不是也经常遇到这种情况:你只是停顿了一下，想思考接下来要说什么，结果 AI 就迫不及待地蹦出来回应;或者你明明已经讲完了，AI 却还在傻傻地等着，直到你忍不住再说一句“我讲完了”它才反应过来，这体验简直让人抓狂。

AI语音识别 AI实时语音处理 LiveKit技术语音识别技术 AI语音处理应用

2025-01-20 08:22:44 380人关注

Resemble AI 发布下一代深度伪造检测模型 Detect-2B:准确率高达94%

Resemble AI，一家领先的语音克隆公司，近日宣布发布了其下一代深度伪造检测模型 Detect-2B。这款新模型在检测 AI 生成的音频方面表现出了约94%的高准确率，标志着深度伪造检测技术的又一重要进步。

Resemble AI AI语音检测 AI检测准确率 AI技术突破 AI语音识别技术

2025-01-15 02:29:43 728人关注

武汉大学联合中国移动九天人工智能团队开源音视频说话人识别数据集 VoxBlink2

武汉大学联合中国移动九天人工智能团队和昆山杜克大学基于YouTube数据开源了超过11万小时的音视频说话人识别数据集VoxBlink2。该数据集包含9904382个高质量音频片段及其相应的视频片段，来自YouTube上的111284名用户，是目前最大的公开可用的音视频说话人识别数据集。数据集的发布旨在丰富开源语音语料库，支持训练声纹大模型。