NanoPoor:为资源有限的开发者打造的高效NanoGPT训练方案。

在单个T4 GPU上实现3.28验证损失;优化后的模型参数减少至约7300万,提升稳定性;提供详细的训练日志和优化建议
 
 
Back to Top