黑洞资源笔记
15:57 · Apr 4, 2025 · Fri
让语言模型具备主动搜索能力的强化学习框架。
通过多轮交互提升模型对长尾和知识密集型任务的性能;支持自定义搜索工具,灵活适配不同需求;采用veRL框架,训练效率更高
Multimodal-Search-R1
| #框架
Home
Powered by
BroadcastChannel
&
Sepia