- 上云资讯 -
2025-06-20 09:12:15 88人关注
OpenAI 推出 ChatGPT Record:实时录音、转录与摘要的新功能
近日,OpenAI 在其 macOS 桌面应用中推出了一项名为 “ChatGPT Record” 的新功能。该功能专为 Pro、Team、Enterprise 和 Edu 用户设计,能够实现录音、转录以及音频摘要的功能。用户在每个会话中最多可以录制120分钟的音频,并且录音将自动生成结构化的摘要内容。
OpenAI ChatGPT Record 录音转录功能 音频摘要技术 AI语音处理 OpenAI桌面应用新功能 企业级AI工具
2025-05-31 16:16:18 84人关注
ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%
ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。
2025-01-06 15:13:25 133人关注
NVIDIA推全新视觉语音模型NVEagle,可以看图跟你聊天
最近,NVIDIA 联合 Georgia Tech、UMD 和 HKPU 的研究团队推出了全新的视觉语言模型 ——NVEagle。它能看懂图片还能跟你聊天,这相当于一个会看会说的超级助手。
2024-12-23 10:22:10 86人关注
清华大学推出突破性音源仿真平台SonicSim AI语音处理要起飞了?
清华大学的研究团队近日发布了名为 SonicSim 的移动音源仿真平台,旨在解决当前语音处理领域在移动声源场景下数据缺乏的难题。