DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

作者：AIbase基地更新时间：2025-12-02 11:11:14 共269人关注

12月1日 — 中国人工智能初创公司深度求索（DeepSeek AI）发布了DeepSeek-V3.2系列模型。该模型包括DeepSeek-V3.2及其高计算增强版DeepSeek-V3.2-Speciale。新模型具有创新的稀疏注意力机制(DSA)和强化的Agent能力，旨在挑战全球顶级AI模型，包括OpenAI的GPT-5和Google的Gemini3.0Pro。

DeepSeek-V3.2系列的核心在于其独有的DeepSeek Sparse Attention （DSA）架构。该机制首次实现了细粒度的稀疏注意力，降低了长文本场景下的计算复杂度和内存占用，同时保持了与密集注意力模型相当的性能。这一技术创新带来了效率提升:

长文本任务上的推理速度提升了2至3倍。

API成本降低，官方宣布价格降低了50%以上。

DeepSeek-V3.2被定位为“Agent优先”的模型，专注于将深度推理能力与工具使用流程深度融合。该模型采用了大规模的 Agent 任务合成流水线进行训练，提高了模型在现实世界应用场景中的泛化能力。新模型引入了“思考模式”，允许模型在执行复杂任务前进行链式逻辑推理，提升了解决问题的准确性。在一系列 Agent 评估中，V3.2达到了开源模型中的最高水平。

此次发布包含两个核心版本:

深度求索已在Hugging Face上开放了V3.2模型的权重，并提供了相关的开源内核和演示代码，支持研究人员和企业进行商业部署。分析人士认为，DeepSeek V3.2的发布标志着AI行业向结合深度推理和实际工具操作的模型迈出了一步，进一步缩小了开源模型与闭源巨头之间的差距。开发者可以通过查阅DeepSeek API 文档了解更多技术细节和使用指南。

地址：https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

推荐阅读

上云服务