2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。

在公开测评中,参赛模型包括夸克、豆包、元宝以及ChatGPT,统一使用2025年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。
在知名媒体蓝鲸财经的评测中,夸克以145分成功登顶。其中,在选择题、填空题方面,夸克的正确率高达93%,位居第一。在8道单项选择题中,所有AI产品都没有答对第六题,通过思维链发现,答错原因是为AI在识别图中的向量坐标和箭头方向时出现偏差。

而在“四木相对论”的评测中,夸克更是以146分,再次登顶。在答题速度上,夸克位列第一,豆包位列第二。以做解答题为例,夸克能在4分钟内完成一道题,其他产品的平均时间在6分钟左右。

支撑夸克解题能力的是“夸克学习灵知大模型”。该模型以通义千问为基础,依托百亿级学习资料库和后训练能力,尤其擅长解决理科类复杂问题,能为用户带来启发式学习的全新体验。