- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-09-09 10:11:12 33人关注
微软14B参数模型挑战671B巨型AI 智能体强化学习重新定义数学推理
微软研究院开源的rStar2-Agent模型在AI数学推理领域引发关注,这款140亿参数的模型通过创新的智能体强化学习技术,在多项数学基准测试中超越了参数量达6710亿的DeepSeek-R1模型。
2025-09-08 10:18:16 42人关注
微软推出新型 AI Agent 模型 rStar2-Agent,以 140 亿参数挑战大规模模型
微软最近在 AI 领域取得了显著突破,开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法,令人惊讶的是,尽管其参数仅有140亿,但在 AIME24数学推理测试中,准确率高达80.6%,成功超越了拥有6710亿参数的 DeepSeek-R1(79.8%)。这样的表现让人们重新思考模型的参数规模与性能之间的关系。