上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-09 10:11:12 238人关注

微软14B参数模型挑战671B巨型AI 智能体强化学习重新定义数学推理

微软研究院开源的rStar2-Agent模型在AI数学推理领域引发关注，这款140亿参数的模型通过创新的智能体强化学习技术，在多项数学基准测试中超越了参数量达6710亿的DeepSeek-R1模型。

AI数学推理智能体强化学习数学基准测试大模型性能对比 DeepSeek-R1 rStar2-Agent

2025-09-08 10:18:16 239人关注

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

微软最近在 AI 领域取得了显著突破，开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法，令人惊讶的是，尽管其参数仅有140亿，但在 AIME24数学推理测试中，准确率高达80.6%，成功超越了拥有6710亿参数的 DeepSeek-R1（79.8%）。这样的表现让人们重新思考模型的参数规模与性能之间的关系。

AI Agent 推理模型智能体强化学习模型参数规模与性能数学推理测试小参数模型优势开源AI模型

- 上云资讯 -

微软14B参数模型挑战671B巨型AI 智能体强化学习重新定义数学推理

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

推荐阅读

上云服务

- 上云资讯 -

微软14B参数模型挑战671B巨型AI 智能体强化学习重新定义数学推理

​微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

推荐阅读

上云服务

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型