OpenManus-RL:一个为LLM Agents开发的强化学习调优开源项目。核心价值在于通过RL优化提升LLM Agents的推理和决策能力。

支持多种推理模型,如Deepseek-R1和QwQ-32B;提供多种奖励策略和训练框架;持续更新,动态分享最新研究成果
 
 
Back to Top