上云资讯 - 来上云吧，企业上云一站式服务

2025-08-29 16:37:23 507人关注

SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

在8月28日发布的中文多模态视觉语言模型测评基准（SuperCLUE-VLM）榜单中，Gemini-2.5-Pro 以总分74.99分位居第一，OpenAI 的 GPT-5(high) 以68.59分排在第二位。

2025-08-09 08:33:30 575人关注

近期，一款名为dots.ocr的多语言文档解析模型引发了AI领域的广泛关注。这款基于1.7B参数的轻量化视觉-语言模型，以其出色的性能和统一布局检测与OCR能力，成为文档处理领域的新星。

2025-01-18 01:43:42 245人关注

近期一项研究表明，通过特殊训练，语言模型可以部分实现更高效的多步骤推理能力。这种能力类似于心理学家丹尼尔·卡尼曼所描述的"系统2推理"，即缓慢而有意识的信息处理方式。

2025-01-17 18:11:15 277人关注

近期，麻省理工学院（MIT）的研究团队对大型语言模型(LLMs)进行了深入的研究，探讨它们在不同任务下的表现。他们发现，尽管这些模型在一些常见的任务上看起来很出色，但实际上它们的推理能力常常被高估，尤其是在面对不熟悉的情境时。

2025-01-12 01:26:21 473人关注

最近，Reddit用户用户@zefman进行了一项有趣的实验，搭建了一个平台，让不同的语言模型（LLM）实时对战国际象棋，目的是用户有趣且轻松的方式来评估这些模型的表现。