上云资讯 - 来上云吧，企业上云一站式服务

AI对话上云服务上云资讯解决方案关于我们

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-04 16:25:12 487人关注

通义推出CoGenAV多模态语音表征模型可实现音画同步感知

近日，通义大模型发布CoGenAV，以音画同步理念创新语音识别技术，有效解决语音识别中噪声干扰的难题。

通义千问多模态语音模型语音模型技术通义千问应用场景多模态技术原理

2025-01-12 14:28:15 350人关注

上交大携手字节跳动推出LSLM：AI语音模型实现"边听边说"突破

近日，上交大LANCE实验室和字节跳动联手推出了一款名为LSLM的新型交互式语音模型。据称，这款模型可以边听边说，效果非常好，接近人类自然的对话方式。

上海交大字节跳动 LSLM AI语音模型语音模型技术

2025-01-08 09:36:15 201人关注

端到端语音大模型新秀:心辰Lingo开放内测预约

西湖心辰近日推出了国内首个端到端语音大模型——心辰Lingo，并已开启内测预约。这一创新模型被誉为国内首个能力追平GPT-4语音能力的AI系统，标志着中国在语音AI领域取得重大突破。

端到端语音模型 Lingo Beta 注册语音模型技术语音AI应用语音模型测试

2025-01-06 15:13:25 310人关注

NVIDIA推全新视觉语音模型NVEagle，可以看图跟你聊天

最近，NVIDIA 联合 Georgia Tech、UMD 和 HKPU 的研究团队推出了全新的视觉语言模型 ——NVEagle。它能看懂图片还能跟你聊天，这相当于一个会看会说的超级助手。

NVIDIA视觉语音模型视觉语音模型技术 NVEagle应用场景语音模型创新 AI语音处理技术

2025-01-05 04:33:14 374人关注

国内首个端到端通用语音大模型「心辰Lingo」正式发布

西湖心辰科技有限公司近日在外滩大会上正式发布了国内首个端到端通用语音大模型——心辰Lingo。该模型自8月1日问世以来，经过内测预约，于9月5日向公众展示了其先进的语音处理能力。心辰Lingo能够直接理解语音，捕捉语气、节奏和情绪，并进行语音回复，减少了信息处理过程中的损失，使机器更能理解人类语言的细微差别。

中文语音模型端到端语音模型新晨灵构语音模型技术语音模型应用场景