阿里巴巴开源 WebSailor AI Agent，打破信息检索壁垒

作者：AIbase基地更新时间：2025-07-28 12:44:12 共415人关注

随着互联网的迅猛发展，信息的爆炸式增长让人类在信息检索上面临诸多挑战。为了应对这些挑战，阿里巴巴的通义实验室推出了一款创新的开源 AI 智能体框架 ——WebSailor。该框架以其卓越的性能，尤其在复杂任务处理上，已在 GitHub 上获得了超过5000颗星的评价，成为每日增长率最高的项目之一。

WebSailor 的开发团队通过多项基准测试验证了其出色的性能。在 BrowseComp-en/zh 测试中，WebSailor 的表现超越了所有现有开源智能体，甚至与一些闭源模型相媲美。此外，在 SimpleQA 基准测试中，WebSailor 同样展示了其在简单任务处理上的优越性。

WebSailor 的核心技术主要集中在复杂任务生成和强化学习两个模块上。这两个模块相辅相成，使得 WebSailor 在处理复杂信息检索任务时展现出更高的效率。

复杂任务生成 :为了模拟真实世界的信息环境，研究团队构建了复杂的知识图谱。这些图谱通过随机游走的方式生成，体现了高度的非线性和复杂性。每个节点代表一个实体，边则显示实体之间的关系，形成多样化的组合，提供了生成高不确定性任务的基础。

强化学习模块 :强化学习的目标是通过与环境的交互优化模型的行为策略。WebSailor 采用了两阶段的训练方法，首先通过拒绝采样的微调阶段（RFT）来冷启动模型，然后进入强化学习阶段。在此过程中，研究团队还引入了动态采样策略优化训练过程，提出了 DUPO 算法，使模型在更少样本下实现更高的性能。

为了进一步增加任务的复杂性，研究团队在生成问答对时引入了信息模糊化技术。这种技术将精确的信息替换为模糊的描述，使得问题更具挑战性，要求模型进行更复杂的推理和信息合成。这一创新手段不仅提高了任务的难度，也提升了模型的智能水平。

随着 WebSailor 的发布，阿里巴巴在人工智能领域的创新又向前迈进了一步。开源的特性不仅有助于技术的普及和发展，也为开发者提供了更多的探索空间和实践机会。未来，WebSailor 有望在信息检索、智能问答等多个领域展现出更大的潜力。

开源地址:https://github.com/Alibaba-NLP/WebAgent