Skip to main content

SafetyBench:开源数据集,通过英文和中文11,435道多项选择题,分为7类涵盖安全隐患,以全面评估语言模型安全性能