LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-02 10:27:25 85人关注

通义大模型发布OmniAudio 可从 360° 视频生成空间音频

近日,通义实验室语音团队在空间音频生成领域取得里程碑式成果,推出OmniAudio技术,该技术可直接从360°视频生成FOA(First-order Ambisonics)音频,为虚拟现实和沉浸式娱乐带来全新可能。

通义大模型 Omni模型 音频360度视频 大模型技术应用 音视频AI处理

2025-03-25 10:19:20 136人关注

阿里通义宣布开源R1-Omni模型 可提升多模态情感识别能力

3月11日,通义实验室团队宣布开源R1-Omni模型,为全模态模型的发展带来了新的突破。该模型结合了强化学习与可验证奖励(RLVR)方法,专注于提升多模态情感识别任务中的推理能力和泛化性能。

阿里巴巴通义R1 多模态情感识别 通义R1情感识别 AI情感分析 多模态AI技术 阿里巴巴AI模型

2025-01-22 05:14:45 119人关注

无问芯穹发布首个端侧全模态理解开源模型Megrez-3B-Omni,融资接近10亿元

国内人工智能公司无问芯穹宣布开源其最新研发的端侧全模态理解 AI 模型 ——Megrez-3B-Omni。这一模型是全球首个此类开源项目,标志着该公司在 AI 领域的创新发展。与此同时,无问芯穹还推出了纯语言版本的模型 Megrez-3B-Instruct,以进一步丰富其产品线。

Megrez-3B Omni模型 大模型融资 AI大模型投资 大模型技术发展

2025-01-05 01:23:26 259人关注

Mini-Omni:开启"边思考边说话"新时代的多模态AI模型

在人工智能快速发展的今天,一款名为Mini-Omni的开源多模态大型语言模型正在引领语音交互技术的革新。这个由多个先进技术集成而成的AI系统,不仅能够实现实时的语音输入和输出,还具备"边思考边说话"的独特能力,为用户带来前所未有的自然交互体验。

多模态AI模型 Omni模型 AI模型技术 多模态技术应用 AI模型最新动态

2025-01-01 06:26:39 204人关注

西湖心辰开源中文情感端到端语音大模型Westlake-Omni

西湖心辰宣布开源其研发的Westlake-Omni模型。作为全球首个开源的中文情感端到端语音交互大模型,Westlake-Omni采用了离散表示法来统一文本和语音模态,特别注重实时性,能够快速响应并提供几乎零延迟的体验。

西湖大学 中文情感分析 语音情感模型 Omni模型 情感语音识别 中文语音处理

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10