阿里发布的 WebAgent 系列,打造面向信息检索的多智能体生态,推动下一代自主信息寻求技术革新 | link
核心产品:WebWalker(ACL 2025 论文)、WebDancer、WebSailor、WebShaper,覆盖从基准测试到复杂推理的全链路能力
• WebShaper:基于信息寻求任务形式化,提出数据合成新方法,刷新 GAIA(60.19)与 WebWalkerQA(52.50)等多个基准最高成绩
• WebSailor:创新后训练策略与强化学习(DUPO),突破超复杂信息检索任务,性能接近商业顶尖系统
• WebDancer:采用 ReAct 框架,构建原生自主搜索推理模型,融合轨迹级监督与强化学习,实现高效冷启动与泛化能力
• WebWalker:为大语言模型设计的 Web 遍历基准和多智能体框架,助力评测与提升网络信息寻求能力
• 生态配套:多阶段训练范式、丰富演示视频、多平台一键部署(含阿里云 FunctionAI),支持快速上手和深度研究
• 长期价值:系统化构建信息寻求代理模型,强调任务形式化与代理智能的内在结合,具备跨任务泛化和行业应用潜力
核心产品:WebWalker(ACL 2025 论文)、WebDancer、WebSailor、WebShaper,覆盖从基准测试到复杂推理的全链路能力
• WebShaper:基于信息寻求任务形式化,提出数据合成新方法,刷新 GAIA(60.19)与 WebWalkerQA(52.50)等多个基准最高成绩
• WebSailor:创新后训练策略与强化学习(DUPO),突破超复杂信息检索任务,性能接近商业顶尖系统
• WebDancer:采用 ReAct 框架,构建原生自主搜索推理模型,融合轨迹级监督与强化学习,实现高效冷启动与泛化能力
• WebWalker:为大语言模型设计的 Web 遍历基准和多智能体框架,助力评测与提升网络信息寻求能力
• 生态配套:多阶段训练范式、丰富演示视频、多平台一键部署(含阿里云 FunctionAI),支持快速上手和深度研究
• 长期价值:系统化构建信息寻求代理模型,强调任务形式化与代理智能的内在结合,具备跨任务泛化和行业应用潜力