LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-14 10:31:17 100人关注

国产AI高考数学实力比拼:夸克领先豆包、元宝

2025年高考刚落下帷幕,一场关于“AI能否解数学高考题”的实战测试同步上演。在专业媒体的两轮测评中,夸克分别以145分和146分位列第一,超越豆包,成为国产AI数学能力的新标杆。

AI数学能力 AI解高考题 AI教育测评 夸克AI数学成绩 国产AI数学标杆

2025-02-08 10:11:42 156人关注

DeepMind 新AI系统超越国际数学奥林匹克金牌选手,解题能力显著提升

近日,谷歌 DeepMind 开发的一款 AI 系统 ——AlphaGeometry2,成功超越了国际数学奥林匹克(IMO)金牌选手的平均水平,在几何问题解答上表现优异。AlphaGeometry2是 DeepMind 在去年发布的 AlphaGeometry 系统的升级版,研究团队在最新的研究中指出,该系统能解决过去25年间 IMO 的84% 几何问题。

DeepMind AI 数学奥赛金牌得主 AI数学能力 AI性能突破 数学竞赛AI应用

2025-01-20 21:19:10 368人关注

​DeepSeek AI 发布新版 DeepSeek-V2.5-1210:数学、编程与写作能力大幅提升

DeepSeek AI 近期推出了 DeepSeek-V2.5-1210,这是 DeepSeek-V2.5的增强版本,旨在提升人工智能在数学、编程、写作和推理任务中的表现。

DeepSeek AI v2 DeepSeek AI 1210 AI数学能力 AI编程能力 AI写作能力 大模型技术更新

2025-01-16 23:11:39 139人关注

数学难题暴露AI短板:13.11>13.8冲上热搜,所有LLM的致命弱点被揭开!

最近,一个简单的数学问题——"13.8和13.11哪个大?"——不仅难倒了部分人类,也让许多大型语言模型(LLM)陷入了困境。这个问题引发了对AI在处理常识性问题上的能力的广泛讨论。

AI数学弱点 AI数学能力缺陷 AI数学问题分析 AI数学局限性 AI数学缺陷研究

2025-01-03 18:43:14 161人关注

强得可怕!有人测试用OpenAI o1解答高中数学期末考题,竟全对了

最近,一位reddit网友在论坛上分享了他使用 OpenAI 最新模型OpenAI o1解答高中数学题的效果,结果竟然全对了。

OpenAI O1 高中数学测试 AI教育应用 OpenAI教育模型 AI数学能力评估

2025-01-01 23:25:26 178人关注

北大阿里联手推出Omni-MATH:AI数学能力的终极挑战

随着OpenAI的GPT-4在传统数学评测中屡创佳绩,北京大学和阿里巴巴的研究团队联手推出了一个全新的评测基准——Omni-MATH,旨在评估大型语言模型在奥林匹克数学竞赛级别的推理能力。这一举措不仅为AI数学能力的评估提供了新标准,也为探索AI在高级数学领域的潜力开辟了新途径。

PKU-ALI Omni数学AI挑战赛 数学AI挑战赛 AI数学竞赛 PKU-ALI合作项目 Omni数学AI赛事

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10