Light-R1:用不到1000美元的成本,从零训练出超越现有数学大模型的AI。

仅用6小时训练时间,成本约1000美元;在AIME24等数学竞赛中超越DeepSeek-R1-Distill-Qwen-32B;提供完整的训练数据和代码,助力低成本复现
 
 
Back to Top