- 上云资讯 -
2025-07-10 13:40:21 99人关注
国内团队创造历史!“人类最后的考试” 首次得分突破30分,AI竞争再升级!
在全球人工智能竞争日益激烈的背景下,上海交通大学与深势科技团队联手,成功在被称为 “人类最后的考试”(HLE)中取得了32.1分的惊人成绩,首次突破30分大关。这一测试集以其超高难度而闻名,曾经没有模型得分能超过10分,甚至在最近,最高得分也仅有26.9分,由 Kimi-Research 和 Gemini Deep Research 并列创造。
上海交通大学人工智能突破 HLE考试32.1分记录 深势科技AI研究 全球AI竞争最新进展 Kimi-Research与Gemini Deep Research对比 人类最后考试HLE难度解析