黑洞资源笔记
15:52 · Apr 4, 2025 · Fri
DeepResearcher
:通过强化学习在真实世界环境中训练LLM基础的深度研究Agent,让研究更智能、更高效。
实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
Home
Powered by
BroadcastChannel
&
Sepia