LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-29 16:37:23 169人关注

SuperCLUE多模态视觉8月评测榜:Gemini-2.5-Pro位居第一

在8月28日发布的中文多模态视觉语言模型测评基准(SuperCLUE-VLM)榜单中,Gemini-2.5-Pro 以总分74.99分位居第一,OpenAI 的 GPT-5(high) 以68.59分排在第二位。

Gemini-2.5-Pro 登顶 SuperCLUE-VLM 榜单 多模态模型评测 GPT-5(high) 排名第二 视觉语言模型性能对比 大模型多模态能力评估

2025-08-09 08:33:30 199人关注

dots.ocr横空出世!1.7B参数多语言文档解析神器,挑战Doubao与Gemini

近期,一款名为dots.ocr的多语言文档解析模型引发了AI领域的广泛关注。这款基于1.7B参数的轻量化视觉-语言模型,以其出色的性能和统一布局检测与OCR能力,成为文档处理领域的新星。

多语言文档解析模型 dots.ocr 轻量化模型 视觉-语言模型性能 文档处理新技术 统一布局检测与OCR

2025-01-18 01:43:42 126人关注

Meta科学家开发"思维提炼"技术 语言模型性能显著提升

近期一项研究表明,通过特殊训练,语言模型可以部分实现更高效的多步骤推理能力。这种能力类似于心理学家丹尼尔·卡尼曼所描述的"系统2推理",即缓慢而有意识的信息处理方式。

meta科学家 思维提取技术 meta科学家研究成果 思维提取技术应用 meta科学家创新技术

2025-01-17 18:11:15 140人关注

​大语言模型推理能力被高估了 在不熟悉场景中有很大的弱点

近期,麻省理工学院(MIT)的研究团队对大型语言模型(LLMs)进行了深入的研究,探讨它们在不同任务下的表现。他们发现,尽管这些模型在一些常见的任务上看起来很出色,但实际上它们的推理能力常常被高估,尤其是在面对不熟悉的情境时。

大语言模型 语言模型弱点 语言模型评估 语言模型应用场景 语言模型性能

2025-01-12 01:26:21 329人关注

Reddit用户实测:GTP-4o在国际象棋上击败Gemini 1.5 pro

最近,Reddit用户用户@zefman进行了一项有趣的实验,搭建了一个平台,让不同的语言模型(LLM)实时对战国际象棋,目的是用户有趣且轻松的方式来评估这些模型的表现。

GPT-4o Gemini 1.5 Pro Reddit用户评测 AI模型对比 大语言模型性能

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10