Super_Muon:高效分片优化器,让大规模模型训练不再卡脖子。

基于分片技术,大幅提升训练效率;结合Newton Schulz算法,优化性能;适配多种模型,灵活易用
 
 
Back to Top