黑洞资源笔记
15:34 · Apr 8, 2025 · Tue
NanoPoor
:为资源有限的开发者打造的高效NanoGPT训练方案。
在单个T4 GPU上实现3.28验证损失;优化后的模型参数减少至约7300万,提升稳定性;提供详细的训练日志和优化建议
Home
Powered by
BroadcastChannel
&
Sepia