- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-01-24 08:20:30 201人关注
果然最强!OpenAI 新模型o3在ARC-AGI基准测试得分破纪录
OpenAI 发布的最新模型 o3在 ARC-AGI 基准测试中取得了惊人的成绩,标准计算条件下得分高达75.7%,而高计算版本更是达到了87.5%。这一成就令 AI 研究界感到意外,但仍无法证明人工智能通用性(AGI)已被破解。
2025-01-20 12:37:32 219人关注
ARC-AGI 基准即将突破,但创始人警告测试设计存在缺陷
人工智能领域的一个重要基准,ARC-AGI,即“通用人工智能抽象和推理语料库”,即将取得突破性进展。然而,测试的创始人弗朗索瓦·肖莱(Francois Chollet)警告,尽管成绩提高,但这并不意味着我们接近实现通用人工智能(AGI)。他指出,这项测试本身存在设计缺陷,且其所能揭示的并非真正的研究突破。