#OCR #表单标注 #工具 ( OCR Form Labeling Tool )(第三方评测)
这是一个开源的表单标记工具,该工具是为Form Recognizer项目而开发的,Form Recognizer 是表单ORC测试工具集 (Form OCR Test Toolset, FOTT) 的一部分。
本仓库的目的是开发并维护和微软表单识别和OCR服务相关的多种工具。目前,表单标注工具是首个发布到本仓库的工具。用户可以提供反馈并根据自己的需求做定制化改动。微软Azure表单识别团队将定期更新源代码。如果你希望参与此项目,请参考下文的参与贡献一节。
FOTT 的标注工具是一个由 React + Redux 开发的 Web 应用程序, 该项目使用 Typescript 语言开发。本项目使用 Create React App 启动。
当前标注工具具有下面这些特性:
标注 PDF、JPEG、TIFF等文档格式里的表单。
通过 Form Recognizer 和标注数据来训练 模型。
使用训练模型预测上述文档里的单张表单,进而从中提取表单里的 key/value 数据。
这是一个开源的表单标记工具,该工具是为Form Recognizer项目而开发的,Form Recognizer 是表单ORC测试工具集 (Form OCR Test Toolset, FOTT) 的一部分。
本仓库的目的是开发并维护和微软表单识别和OCR服务相关的多种工具。目前,表单标注工具是首个发布到本仓库的工具。用户可以提供反馈并根据自己的需求做定制化改动。微软Azure表单识别团队将定期更新源代码。如果你希望参与此项目,请参考下文的参与贡献一节。
FOTT 的标注工具是一个由 React + Redux 开发的 Web 应用程序, 该项目使用 Typescript 语言开发。本项目使用 Create React App 启动。
当前标注工具具有下面这些特性:
标注 PDF、JPEG、TIFF等文档格式里的表单。
通过 Form Recognizer 和标注数据来训练 模型。
使用训练模型预测上述文档里的单张表单,进而从中提取表单里的 key/value 数据。