随着互联网的迅猛发展,信息的爆炸式增长让人类在信息检索上面临诸多挑战。为了应对这些挑战,阿里巴巴的通义实验室推出了一款创新的开源 AI 智能体框架 ——WebSailor。该框架以其卓越的性能,尤其在复杂任务处理上,已在 GitHub 上获得了超过5000颗星的评价,成为每日增长率最高的项目之一。

images.png

WebSailor 的开发团队通过多项基准测试验证了其出色的性能。在 BrowseComp-en/zh 测试中,WebSailor 的表现超越了所有现有开源智能体,甚至与一些闭源模型相媲美。此外,在 SimpleQA 基准测试中,WebSailor 同样展示了其在简单任务处理上的优越性。

WebSailor 的核心技术主要集中在复杂任务生成和强化学习两个模块上。这两个模块相辅相成,使得 WebSailor 在处理复杂信息检索任务时展现出更高的效率。

复杂任务生成 :为了模拟真实世界的信息环境,研究团队构建了复杂的知识图谱。这些图谱通过随机游走的方式生成,体现了高度的非线性和复杂性。每个节点代表一个实体,边则显示实体之间的关系,形成多样化的组合,提供了生成高不确定性任务的基础。

强化学习模块 :强化学习的目标是通过与环境的交互优化模型的行为策略。WebSailor 采用了两阶段的训练方法,首先通过拒绝采样的微调阶段(RFT)来冷启动模型,然后进入强化学习阶段。在此过程中,研究团队还引入了动态采样策略优化训练过程,提出了 DUPO 算法,使模型在更少样本下实现更高的性能。

images.png

为了进一步增加任务的复杂性,研究团队在生成问答对时引入了信息模糊化技术。这种技术将精确的信息替换为模糊的描述,使得问题更具挑战性,要求模型进行更复杂的推理和信息合成。这一创新手段不仅提高了任务的难度,也提升了模型的智能水平。

随着 WebSailor 的发布,阿里巴巴在人工智能领域的创新又向前迈进了一步。开源的特性不仅有助于技术的普及和发展,也为开发者提供了更多的探索空间和实践机会。未来,WebSailor 有望在信息检索、智能问答等多个领域展现出更大的潜力。

开源地址:https://github.com/Alibaba-NLP/WebAgent