Skip to main content

baichuan-7B是由百川智能开发的一个开源可用商业的大型预演训练语言模型

  1. baichuan-7B是由百川智能开发的一个开源可用商业的大型预演训练语言模型。基于Transformer结构,在大约1.2万亿代币上演训练的70亿参数字模型,支持中英双语,上下窗口长度为4096。在标准的中文和英文权限基准测试(C-EVAL/MMLU)上平均取得同等尺寸最好的效果。