DeepSick-R1:轻松复现DeepSeek-R1的高效代码库。

代码简洁,仅3个核心文件(main.py、trainer.py、utils.py),总825行代码;使用vLLM加速生成,效率大幅提升;支持多GPU训练,训练速度显著提升
 
 
Back to Top