如果您需要任何上云服务
请随时联系我们:
电话:021-50583875
2025-01-27 21:24:22 53人关注
今天,阿里云通义团队正式发布了全新的数学推理过程奖励模型 Qwen2.5-Math-PRM。该模型提供了72B 和7B 两种尺寸,性能表现均显著优于同类的开源过程奖励模型,尤其是在识别推理错误方面表现突出。
阿里云通义千问2.5 数学大模型PRM-7B GPT4o对比 大模型技术解析 通义千问2.5数学能力