NanoPoor：为资源有限的开发者打造的高效NanoGPT训练方案

NanoPoor：为资源有限的开发者打造的高效NanoGPT训练方案。

在单个T4 GPU上实现3.28验证损失；优化后的模型参数减少至约7300万，提升稳定性；提供详细的训练日志和优化建议