在8月28日发布的中文多模态视觉语言模型测评基准(SuperCLUE-VLM)榜单中,Gemini-2.5-Pro 以总分74.99分位居第一,OpenAI 的 GPT-5(high) 以68.59分排在第二位。

images.png

该基准基于中文场景特点,围绕基础认知、视觉推理和视觉应用三大核心维度构建评测体系,力求为多模态视觉语言模型的发展提供客观、公正的评估标准。

此次评测共涵盖了Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等共计15个多模态模型,涵盖国内外主流模型。

images.png

最终,Gemini-2.5-Pro 以总分74.99分位居第一,OpenAI 的 GPT-5(high) 以68.59分排在第二位,而百度的 ERNIE-4.5-Turbo-VL 则与其他国内模型并列,显示出强劲的市场竞争力。