DeepResearcher:通过强化学习在真实世界环境中训练LLM基础的深度研究Agent,让研究更智能、更高效。

实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
 
 
Back to Top