Skip to main content

pycorrector: 中文文本纠错工具

  1. pycorrector: 中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3开发。重点解决其中的"音似、形字、语法、专名错误"等类型。

    pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模型的文本纠错,并在SigHAN数据集评估各模型的效果。

    新增了ChatGLM3/LLaMA2等GPT模型用于中文文本纠错,发布了基于ChatGLM3-6B的shibing624/chatglm3-6b-csc-chinese-lora拼写和语法纠错模型;重写了DeepContext、ConvSeq2Seq、T5等模型的实现。详见Release-v1.0.0

    pycorrector | #工具