Reasoning360:助力大规模推理模型研究的开源项目。它为研究人员提供了从数据处理到模型训练和评估的全流程工具

提供92K跨领域强化学习数据;支持多节点训练和评估;集成SandboxFusion安全代码执行环境
 
 
Back to Top