在 DeepSeek R1 开源发布引爆全球关注后,更多大模型公司加速推出了深度思考模型,并计划或已经开源。

阿里通义团队日前就推出了新款深度思考模型 QwQ-Max-Preview,并支持联网搜索,这款模型目前已在通义千问的新官网(https://chat.qwen.ai/)上线,会在不久后开源。

images.png

QwQ-Max-Preview 是基于 Qwen2.5-Max 所构建的推理模型。Qwen2.5-Max 作为阿里重要的超大规模 MoE 模型,经过超 20 万亿 tokens 的预训练数据锤炼,在多个基准测试中表现卓越,超越 DeepSeek V3、GPT-4o 等领先 AI,为 QwQ-Max-Preview 奠定了坚实基础。

目前该模型处于预览阶段,阿里 Qwen 团队也表明会持续对其进行优化,未来将发布 QwQ-Max 正式版,同步推出 Android 和 iOS 端的 App,还将基于开源软件许可证 Apache2.0,开放 QwQ-Max 和 Qwen2.5-Max 的权重。同时,计划发布如 QwQ-32B 这类可部署在本地设备的更小模型。

它支持深度思考和联网搜索两大核心功能。在深度思考方面,能够对复杂问题进行深入剖析;联网搜索功能则让模型突破自身知识局限,可实时获取互联网信息辅助推理。

images.png images.png images.png images.png

阿里推出的 QwQ-Max-Preview 深度思考模型,凭借其在数学、编程、推理等多方面的出色能力,以及独特的联网搜索与多模态布局,为用户开启了全新的 AI 体验大门。尽管当前处于预览阶段,在实际使用中可能存在一些小瑕疵,但随着后续正式版的发布以及持续优化,相信它将在教育、创意、开发等众多领域发挥更大价值。

欢迎在评论区分享使用感受与建议,共同见证这款模型不断成长与完善,也期待阿里在 AI 领域持续创新,为我们带来更多惊喜与突破。