黑洞资源笔记
14:55 · Mar 10, 2025 · Mon
OpenManus-RL
:一个为LLM Agents开发的强化学习调优开源项目。核心价值在于通过RL优化提升LLM Agents的推理和决策能力。
支持多种推理模型,如Deepseek-R1和QwQ-32B;提供多种奖励策略和训练框架;持续更新,动态分享最新研究成果
Home
Powered by
BroadcastChannel
&
Sepia