微信扫码
添加专属顾问
2025-09-09 10:11:12 33人关注
微软研究院开源的rStar2-Agent模型在AI数学推理领域引发关注,这款140亿参数的模型通过创新的智能体强化学习技术,在多项数学基准测试中超越了参数量达6710亿的DeepSeek-R1模型。
AI数学推理 智能体强化学习 数学基准测试 大模型性能对比 DeepSeek-R1 rStar2-Agent