ALE-Bench:为AI系统在算法编程竞赛中的表现提供基准测试。

基于AtCoder启发式竞赛的真实任务;提供从公共测试到私有测试的完整评估流程;支持多种编程语言和并行评估,提升效率
 
 
Back to Top