2025-01-28 10:37:18
297人关注
DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1
2025年1月20日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。
DeepSeek R1
DeepSeek 推理模型
OpenAI O1
大模型推理技术
DeepSeek 新模型发布
AI 推理模型对比