Skip to main content

通过分析发现代码数据中存在大量低质量过长文件,并证明基于删除这些长文件这一简单启发式进行数据裁剪,可以在计算资源有限的情况下显著提升代码生成模型的效率和性能

  1. 通过分析发现代码数据中存在大量低质量过长文件,并证明基于删除这些长文件这一简单启发式进行数据裁剪,可以在计算资源有限的情况下显著提升代码生成模型的效率和性能。 ​​​| paper