让语言模型具备主动搜索能力的强化学习框架。

通过多轮交互提升模型对长尾和知识密集型任务的性能;支持自定义搜索工具,灵活适配不同需求;采用veRL框架,训练效率更高

Multimodal-Search-R1 | #框架
 
 
Back to Top