NVIDIA NeMo-RL:为了模型强化而设计的高效可扩展的 post-training 库,支持从小型到超过 100 亿参数的模型。

支持1到数千GPU的灵活扩展;高性能实现,支持超过1000亿参数的大模型;无缝集成Hugging Face,快速上手
 
 
Back to Top