12:56 · Nov 3, 2023 · Fri × DeepSeek Coder:开源代码语言模型,包含了英语和中文两种语言版本的代码生成模型。模型经过大规模训练,训练数据中87%为代码数据,13%为自然语言数据。模型大小提供1B、5.7B、6.7B、33B等多个版本,满足不同需求。模型在人工评估、多语言程序、MBPP、DS-1000等多个编程基准上均表现出色,在项目级代码补全、代码插入等任务有很好的效果。