NVIDIA NeMo-RL：为了模型强化而设计的高效可扩展的 post-training 库，支持从小型到超过 100 亿参数的模型

NVIDIA NeMo-RL：为了模型强化而设计的高效可扩展的 post-training 库，支持从小型到超过 100 亿参数的模型。

支持1到数千GPU的灵活扩展；高性能实现，支持超过1000亿参数的大模型；无缝集成Hugging Face，快速上手