上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-12-03 15:18:11 451人关注

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线，多模态推理一次跑完

vLLM团队发布首个“全模态”推理框架vLLM-Omni，将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs，开发者可立即pip安装并调用。

2025-11-29 10:31:33 148人关注

快手旗舰 Keye-VL-671B-A37B 重磅发布，多模态推理能力实现新突破

快手近日正式发布其新一代旗舰多模态模型 Keye-VL-671B-A37B，并同步开放代码。这一模型以其 “善看会想” 的特性，在通用视觉理解、视频分析和数学推理等多项核心 benchmark 中表现突出，进一步巩固了快手在人工智能领域的技术实力。

2025-08-23 11:32:18 192人关注

刷新科技前沿！InternLM推出8B参数的轻量级多模态推理模型

近日，InternLM 团队正式发布了其开源的轻量级多模态推理模型 ——Intern-S1-mini。该模型参数仅为8B，结合了先进的 Qwen3-8B 语言模型与0.3B 视觉编码器 InternViT，展现出强大的处理能力和灵活性。

InternLM开源模型轻量级多模态推理 Intern-S1-mini参数 Qwen3-8B语言模型 InternViT视觉编码器

2025-07-12 17:21:44 389人关注

阿里HumanOmniV2震撼发布：多模态AI新王者，准确率飙升至69.33%

阿里巴巴集团近期正式推出其最新多模态大语言模型HumanOmniV2，在AI领域再掀波澜。这款模型以其强大的全局上下文理解能力和多模态推理能力，标志着阿里巴巴在人工智能技术的又一次重大突破。

阿里巴巴多模态大模型 HumanOmniV2技术解析多模态推理能力全局上下文理解阿里巴巴AI技术突破

2025-07-10 09:13:29 348人关注

昆仑万维重磅发布 Skywork-R1V 3.0：跨模态推理能力直逼人类专家！

近日，昆仑万维正式发布了其全新开源模型 Skywork-R1V3.0，宣称在多模态推理方面达到了前所未有的高度，甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略，使得其在复杂逻辑建模与跨学科知识泛化方面取得了显著进展。

昆仑万维开源模型 Skywork-R1V3.0 多模态推理模型强化学习策略复杂逻辑建模跨学科知识泛化

2025-07-03 09:28:34 389人关注

智谱AI重磅开源GLM-4.1V-Thinking！多模态推理新王者，挑战全球顶尖模型

中国人工智能领域的领军企业智谱AI（Zhipu AI）再次掀起行业热潮。AIbase最新获悉，智谱AI于近日正式开源其新一代通用视觉模型GLM-4.1V-Thinking。这款9亿参数的多模态推理模型凭借卓越的性能和广泛的应用场景，不仅在多项权威评测中刷新纪录，还展现了比肩甚至超越72亿参数模型的强大实力。以下是AIbase整理的最新资讯，带您深入了解这一突破性技术。

2025-07-03 09:22:45 418人关注

智谱AI开源GLM-4.1V-Thinking:多模态推理模型再突破

智谱AI正式开源最新一代通用视觉模型GLM-4.1V-Thinking，基于GLM-4V架构，新增思维链推理机制，显著提升复杂认知任务能力。该模型支持图像、视频、文档等多模态输入，擅长长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent及代码生成等多样化场景，覆盖千行百业的应用需求。

2025-01-28 13:32:21 459人关注

月之暗面发布新一代SOTA模型 k1.5：多模态推理能力再升级

月之暗面公司隆重推出其全新的 SOTA（state-of-the-art）模型 ——k1.5多模态思考模型，标志着在多模态推理和通用推理领域的重大突破。该模型不仅具备出色的多模态处理能力，还展示了卓越的通用推理能力，能够有效应对各类复杂任务。

月球背面 SOTA模型 K15模型多模态推理太空探索AI模型

2025-01-24 10:40:20 444人关注

阿里发布多模态推理模型QVQ-72B！视觉、语言能力双提升，复杂问题迎刃而解

阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型，该模型基于Qwen2-VL-72B构建，融合了强大的语言和视觉能力，能够处理更为复杂的推理和分析任务，标志着阿里巴巴在多模态AI领域取得了新的突破。

阿里 QVQ-72B 多模态推理模型大模型技术应用阿里大模型新闻 AI 多模态技术

- 上云资讯 -