Skip to main content

数据处理中要手动检查和脱敏个人信息,PII检测工具繁多、速度慢、部署复杂,还得担心隐私泄露和合规问题

  1. 数据处理中要手动检查和脱敏个人信息,PII检测工具繁多、速度慢、部署复杂,还得担心隐私泄露和合规问题。

    OpenAI Privacy Filter 将PII检测与脱敏完美整合,提供高效、本地运行的隐私保护解决方案。

    不仅能双向识别8类隐私标签(姓名、邮箱、电话、地址、日期、URL、账号、密钥),还支持长上下文128k token、浏览器/本地运行、精确召回调节,甚至能针对自定义数据微调优化。

    主要功能:

    - 双向token分类,支持8类PII(private_person/email/phone等)实时检测与masking;
    - 高吞吐量推理,一次前向pass处理整个序列,无需分块,支持128k长上下文;
    - 本地CLI工具,一键redact文件/管道,支持GPU/CPU,浏览器直跑;
    - 可微调训练,适配企业特定隐私策略和数据分布;
    - 多种运行模式:redact、eval、train,输出结构化JSON,Apache 2.0许可商用;
    - 约束Viterbi解码,确保span边界连贯,支持precision/recall调节。

    支持Web浏览器、Python本地部署,pip install后即用,适合开发团队、数据工程师和隐私合规场景。