上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-03-15 10:34:20 455人关注

360智脑团队成功复现Deepseek强化学习效果，发布开源模型Light-R1-14B-DS

近日，360智脑团队宣布成功复现Deepseek的强化学习效果，并正式发布开源推理模型 Light-R1-14B-DS。该模型性能表现超越 DeepSeek-R1-Distill-Llama-70B和 DeepSeek-R1-Distill-Qwen-32B，成为业界首款在14B参数规模上实现强化学习效果的模型，显著提升了数学推理能力，成绩超过大多数32B级别模型。

DeepSeek Light R1-14B AI大模型大模型技术 DeepSeek模型解析大模型应用场景 AI技术前沿

- 上云资讯 -

360智脑团队成功复现Deepseek强化学习效果，发布开源模型Light-R1-14B-DS

推荐阅读

上云服务