上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-14 10:31:17 676人关注

国产AI高考数学实力比拼:夸克领先豆包、元宝

2025年高考刚落下帷幕，一场关于“AI能否解数学高考题”的实战测试同步上演。在专业媒体的两轮测评中，夸克分别以145分和146分位列第一，超越豆包，成为国产AI数学能力的新标杆。

2025-02-08 10:11:42 329人关注

DeepMind 新AI系统超越国际数学奥林匹克金牌选手，解题能力显著提升

近日，谷歌 DeepMind 开发的一款 AI 系统 ——AlphaGeometry2，成功超越了国际数学奥林匹克（IMO）金牌选手的平均水平，在几何问题解答上表现优异。AlphaGeometry2是 DeepMind 在去年发布的 AlphaGeometry 系统的升级版，研究团队在最新的研究中指出，该系统能解决过去25年间 IMO 的84% 几何问题。

DeepMind AI 数学奥赛金牌得主 AI数学能力 AI性能突破数学竞赛AI应用

2025-01-20 21:19:10 604人关注

DeepSeek AI 发布新版 DeepSeek-V2.5-1210：数学、编程与写作能力大幅提升

DeepSeek AI 近期推出了 DeepSeek-V2.5-1210，这是 DeepSeek-V2.5的增强版本，旨在提升人工智能在数学、编程、写作和推理任务中的表现。

DeepSeek AI v2 DeepSeek AI 1210 AI数学能力 AI编程能力 AI写作能力大模型技术更新

2025-01-16 23:11:39 315人关注

数学难题暴露AI短板：13.11＞13.8冲上热搜，所有LLM的致命弱点被揭开！

最近，一个简单的数学问题——"13.8和13.11哪个大?"——不仅难倒了部分人类，也让许多大型语言模型（LLM）陷入了困境。这个问题引发了对AI在处理常识性问题上的能力的广泛讨论。

AI数学弱点 AI数学能力缺陷 AI数学问题分析 AI数学局限性 AI数学缺陷研究

2025-01-03 18:43:14 395人关注

强得可怕！有人测试用OpenAI o1解答高中数学期末考题，竟全对了

最近，一位reddit网友在论坛上分享了他使用 OpenAI 最新模型OpenAI o1解答高中数学题的效果，结果竟然全对了。

OpenAI O1 高中数学测试 AI教育应用 OpenAI教育模型 AI数学能力评估

2025-01-01 23:25:26 398人关注

北大阿里联手推出Omni-MATH：AI数学能力的终极挑战

随着OpenAI的GPT-4在传统数学评测中屡创佳绩，北京大学和阿里巴巴的研究团队联手推出了一个全新的评测基准——Omni-MATH，旨在评估大型语言模型在奥林匹克数学竞赛级别的推理能力。这一举措不仅为AI数学能力的评估提供了新标准，也为探索AI在高级数学领域的潜力开辟了新途径。

PKU-ALI Omni数学AI挑战赛数学AI挑战赛 AI数学竞赛 PKU-ALI合作项目 Omni数学AI赛事

- 上云资讯 -

国产AI高考数学实力比拼:夸克领先豆包、元宝

DeepMind 新AI系统超越国际数学奥林匹克金牌选手，解题能力显著提升

DeepSeek AI 发布新版 DeepSeek-V2.5-1210：数学、编程与写作能力大幅提升

数学难题暴露AI短板：13.11＞13.8冲上热搜，所有LLM的致命弱点被揭开！

强得可怕！有人测试用OpenAI o1解答高中数学期末考题，竟全对了

北大阿里联手推出Omni-MATH：AI数学能力的终极挑战

推荐阅读

上云服务

- 上云资讯 -

国产AI高考数学实力比拼:夸克领先豆包、元宝

DeepMind 新AI系统超越国际数学奥林匹克金牌选手，解题能力显著提升

​DeepSeek AI 发布新版 DeepSeek-V2.5-1210：数学、编程与写作能力大幅提升

数学难题暴露AI短板：13.11＞13.8冲上热搜，所有LLM的致命弱点被揭开！

强得可怕！有人测试用OpenAI o1解答高中数学期末考题，竟全对了

北大阿里联手推出Omni-MATH：AI数学能力的终极挑战

推荐阅读

上云服务

DeepSeek AI 发布新版 DeepSeek-V2.5-1210：数学、编程与写作能力大幅提升