TinyZero:用不到30美元的成本,重现大型语言模型的自我进化能力。

1. 仅需30美元即可体验大型模型的推理能力;
2. 3B基础模型通过强化学习自主发展推理能力;
3. 提供完整的实验日志和开源代码,方便复现和学习
 
 
Back to Top