上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-29 16:37:23 507人关注

SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

在8月28日发布的中文多模态视觉语言模型测评基准（SuperCLUE-VLM）榜单中，Gemini-2.5-Pro 以总分74.99分位居第一，OpenAI 的 GPT-5(high) 以68.59分排在第二位。

Gemini-2.5-Pro 登顶 SuperCLUE-VLM 榜单多模态模型评测 GPT-5(high) 排名第二视觉语言模型性能对比大模型多模态能力评估

2025-01-21 03:23:19 533人关注

通义千问联合魔搭社区开源测试集P-MMEval：可评测模型多语言能力

阿里巴巴达摩院联合魔搭社区ModelScope近期宣布开源一项新的多语言基准测试集P-MMEval，旨在全面评估大型语言模型（LLM）的多语言能力，并进行跨语言迁移能力的比较分析。这一测试集覆盖了基础和专项能力的高效数据集，确保了所有挑选的数据集中多语言覆盖的一致性，并提供了跨多种语言的并行样本，最高支持来自8个不同语族的10种语言，包括英语、中文、阿拉伯语、西班牙语、日语、韩语、泰语、法语、葡萄牙语和越南语。

多语言模型评估 MMEval评测框架大模型评测工具模型评估方法多模态模型评测

- 上云资讯 -

SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

通义千问联合魔搭社区开源测试集P-MMEval：可评测模型多语言能力

推荐阅读

上云服务