- 上云资讯 -
2025-12-03 15:18:11 110人关注
vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线,多模态推理一次跑完
vLLM团队发布首个“全模态”推理框架vLLM-Omni,将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs,开发者可立即pip安装并调用。
2025-11-29 10:31:33 54人关注
快手旗舰 Keye-VL-671B-A37B 重磅发布,多模态推理能力实现新突破
快手近日正式发布其新一代旗舰多模态模型 Keye-VL-671B-A37B,并同步开放代码。这一模型以其 “善看会想” 的特性,在通用视觉理解、视频分析和数学推理等多项核心 benchmark 中表现突出,进一步巩固了快手在人工智能领域的技术实力。
2025-08-23 11:32:18 128人关注
刷新科技前沿!InternLM推出8B参数的轻量级多模态推理模型
近日,InternLM 团队正式发布了其开源的轻量级多模态推理模型 ——Intern-S1-mini。该模型参数仅为8B,结合了先进的 Qwen3-8B 语言模型与0.3B 视觉编码器 InternViT,展现出强大的处理能力和灵活性。
InternLM开源模型 轻量级多模态推理 Intern-S1-mini参数 Qwen3-8B语言模型 InternViT视觉编码器
2025-07-12 17:21:44 302人关注
阿里HumanOmniV2震撼发布:多模态AI新王者,准确率飙升至69.33%
阿里巴巴集团近期正式推出其最新多模态大语言模型HumanOmniV2,在AI领域再掀波澜。这款模型以其强大的全局上下文理解能力和多模态推理能力,标志着阿里巴巴在人工智能技术的又一次重大突破。
2025-07-03 09:28:34 305人关注
智谱AI重磅开源GLM-4.1V-Thinking!多模态推理新王者,挑战全球顶尖模型
中国人工智能领域的领军企业智谱AI(Zhipu AI)再次掀起行业热潮。AIbase最新获悉,智谱AI于近日正式开源其新一代通用视觉模型GLM-4.1V-Thinking。这款9亿参数的多模态推理模型凭借卓越的性能和广泛的应用场景,不仅在多项权威评测中刷新纪录,还展现了比肩甚至超越72亿参数模型的强大实力。以下是AIbase整理的最新资讯,带您深入了解这一突破性技术。
2025-07-03 09:22:45 304人关注
智谱AI开源GLM-4.1V-Thinking:多模态推理模型再突破
智谱AI正式开源最新一代通用视觉模型GLM-4.1V-Thinking,基于GLM-4V架构,新增思维链推理机制,显著提升复杂认知任务能力。该模型支持图像、视频、文档等多模态输入,擅长长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent及代码生成等多样化场景,覆盖千行百业的应用需求。
2025-01-24 10:40:20 353人关注
阿里发布多模态推理模型QVQ-72B!视觉、语言能力双提升,复杂问题迎刃而解
阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。
