- 上云资讯 -
2025-06-16 12:37:29 1人关注
字节火山引擎澄清与老凤祥 AI 智能眼镜合作传闻
近日,有关字节跳动旗下的火山引擎与中国珠宝品牌老凤祥合作开发 AI 智能眼镜的消息引发关注。根据6月11日的报道,一些知情人士透露,老凤祥即将推出多款搭载字节豆包大模型的 AI 眼镜,预计将在七月正式发布。这些产品主要针对老年群体,具备视觉理解、语音对话、语义识别、电话接听等多种功能。
2025-05-31 16:16:18 21人关注
ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%
ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。
2024-12-27 20:30:35 45人关注
突破性语音识别技术:FunASR推出多语种离线转录利器
近日,FunASR推出了一款功能强大的多语言离线文件转录软件包,为用户提供了高效、精准的语音转文本解决方案。
2024-12-27 14:19:44 27人关注
Gladia语音识别API获1600万美元A轮融资,挑战亚马逊、微软和谷歌
法国初创公司Gladia提供了一种语音识别应用程序编程接口(API),在A轮融资中筹集了1600万美元。本质上,Gladia的API能够将任何音频文件以高准确度和低延迟转换成文本。
Gladia语音识别API 语音识别API融资 Gladia融资1600万 语音识别技术融资 Gladia API应用场景
2024-12-24 18:44:32 33人关注
AI语音转录工具Whisper被曝存在严重“幻觉” ,时常瞎编胡造
最近,一款由 OpenAI 的 Whisper 技术驱动的 AI 转录工具在医疗行业广受欢迎。许多医生和医疗机构都在使用这个工具来记录和总结与患者的会面。
2024-12-23 22:41:36 33人关注
Claude APP新增语音功能:Anthropic小范围测试最长10分钟语音听写
据悉,人工智能公司 Anthropic 正在对其 Claude 应用程序进行新功能测试。有消息称,该公司正在小范围内测试语音听写功能,用户可以进行长达 10 分钟的语音录制,由 Claude 进行转录。
2024-12-22 10:38:37 35人关注
新开源语音识别模型Moonshine:速度比OpenAI Whisper快五倍
美国初创公司 Useful Sensors 推出了一款名为 Moonshine 的开源语音识别模型。Moonshine 的设计旨在更高效地处理音频数据,相比于 OpenAI 的 Whisper,它在计算资源的使用上更为经济,处理速度快五倍。这一新模型专为在资源有限的硬件上实现实时应用而打造,具有灵活的架构。