黑洞资源笔记
15:07 · Mar 6, 2025 · Thu
Light-R1
:用不到1000美元的成本,从零训练出超越现有数学大模型的AI。
仅用6小时训练时间,成本约1000美元;在AIME24等数学竞赛中超越DeepSeek-R1-Distill-Qwen-32B;提供完整的训练数据和代码,助力低成本复现
Home
Powered by
BroadcastChannel
&
Sepia