05:07 · Jul 4, 2024 · Thu × 通过分析发现代码数据中存在大量低质量过长文件,并证明基于删除这些长文件这一简单启发式进行数据裁剪,可以在计算资源有限的情况下显著提升代码生成模型的效率和性能。 | paper