14:33 · Sep 30, 2022 · Fri × 用于计算各种文本特性并用它们轻松分析数据集和模型的库这是一个简单的数据分析工具包,由以下组件组成:实现多种文本特征用于计算所有尺度数据的这些指标的工具(单个文本 -> 十亿令牌语料库)使用计算的特征的工具:-可视化和分析给定文本语料库上的特征分布-找出文本属性与模型性能之间的相关性。该工具包正在进行中,工具和分析仍在添加中。项目地址