DeepResearcher：通过强化学习在真实世界环境中训练LLM基础的深度研究Agent，让研究更智能、更高效

DeepResearcher：通过强化学习在真实世界环境中训练LLM基础的深度研究Agent，让研究更智能、更高效。

实现高达28.9分的性能提升，远超传统方法；独特的端到端训练，让Agent具备规划、验证、反思等认知行为；支持真实网络搜索交互，让研究更贴近实际应用场景