LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-04 16:25:12 110人关注

通义推出CoGenAV多模态语音表征模型 可实现音画同步感知

近日,通义大模型发布CoGenAV,以音画同步理念创新语音识别技术,有效解决语音识别中噪声干扰的难题。

通义千问 多模态语音模型 语音模型技术 通义千问应用场景 多模态技术原理

2025-01-12 14:28:15 154人关注

上交大携手字节跳动推出LSLM:AI语音模型实现"边听边说"突破

近日,上交大LANCE实验室和字节跳动联手推出了一款名为LSLM的新型交互式语音模型。据称,这款模型可以边听边说,效果非常好,接近人类自然的对话方式。

上海交大 字节跳动 LSLM AI语音模型 语音模型技术

2025-01-08 09:36:15 70人关注

端到端语音大模型新秀:心辰Lingo开放内测预约

西湖心辰近日推出了国内首个端到端语音大模型——心辰Lingo,并已开启内测预约。这一创新模型被誉为国内首个能力追平GPT-4语音能力的AI系统,标志着中国在语音AI领域取得重大突破。

端到端语音模型 Lingo Beta 注册 语音模型技术 语音AI应用 语音模型测试

2025-01-06 15:13:25 133人关注

​NVIDIA推全新视觉语音模型NVEagle,可以看图跟你聊天

最近,NVIDIA 联合 Georgia Tech、UMD 和 HKPU 的研究团队推出了全新的视觉语言模型 ——NVEagle。它能看懂图片还能跟你聊天,这相当于一个会看会说的超级助手。

NVIDIA视觉语音模型 视觉语音模型技术 NVEagle应用场景 语音模型创新 AI语音处理技术

2025-01-05 04:33:14 166人关注

国内首个端到端通用语音大模型「心辰Lingo」正式发布

西湖心辰科技有限公司近日在外滩大会上正式发布了国内首个端到端通用语音大模型——心辰Lingo。该模型自8月1日问世以来,经过内测预约,于9月5日向公众展示了其先进的语音处理能力。心辰Lingo能够直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信息处理过程中的损失,使机器更能理解人类语言的细微差别。

中文语音模型 端到端语音模型 新晨灵构 语音模型技术 语音模型应用场景

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10