黑洞资源笔记
14:35 · Mar 4, 2025 · Tue
Super_Muon
:高效分片优化器,让大规模模型训练不再卡脖子。
基于分片技术,大幅提升训练效率;结合Newton Schulz算法,优化性能;适配多种模型,灵活易用
Home
Powered by
BroadcastChannel
&
Sepia