Skip to main content

Search: #ocr

  1. iOS OCR Server 利用 Apple Vision Framework,将 iPhone 转变为本地高精度 OCR 服务器,实现无云依赖、无限制使用与完整隐私保护:

    • 自动启动服务器,局域网内设备通过 IP 访问,方便快捷
    • 支持多语言自动识别,适配多国文字环境
    • 通过 Web 上传图片,秒级返回文本识别结果,效率极高
    • JSON 格式 API,轻松集成进自有应用,支持 Python 等多语言调用
    • 100% 本地处理,无需联网,确保数据安全与隐私无忧
    • 可在同一网络内共享 OCR 服务,多设备协同构建分布式识别系统
    • iOS 引导访问模式保证持续运行,适合自动化、批量识别场景

    摒弃传统云 OCR 的延迟与隐私风险,iOS OCR Server 让本地设备成为智能文字识别中心,适合开发者、企业和隐私敏感场景长期使用。| #OCR
  2. 为微信OCR功能提供跨语言调用接口的开源项目。

    支持多种编程语言(C++、Python、Java、C#等);兼容Windows和Linux系统;提供同步和异步调用模式

    WeChatOCR | #OCR
  3. 基于PaddleOCR & OnnxRuntime的跨平台OCR库

    百度paddlepaddle工程化不是太好,为了方便大家在各种端上进行ocr推理,我们将它转换为onnx格式,使用python/c++/java/swift/c# 将它移植到各个平台。

    RapidOCR (捷智OCR):英文版 | 中文版 | #ocr
  4. 百度技术团队在 GitHub 开源的一套丰富且实用的 #OCR 工具库:PaddleOCR,可帮助开发者快速集成 OCR 功能。

    近期该项目发布了功能更新,主要如下:

    - 优化了超轻量 OCR 系统 PP-OCR 效果;
    - 新增表格文字、不规则文字等复杂 OCR 任务的标注工具;
    - 打通 22 种 OCR 不同训练部署软硬件环境与方式;
    - 发布首本交互式 OCR 全栈电子书《动手学 OCR》。

    针对此项目,开发者将开放 3 场公开课,主讲 OCR 技术解析、AI 模型训练部署实践、OCR 技术产业应用案例、落地方案分享等内容。


    报名地址 直播时间:5.11 - 5.13,每晚 20:30
  5. 百度对外开放了一个技术教程:《十讲OCR开源课》,教程作者为 GitHub 项目 PaddleOCR 的开发者。该课将分为 10 个章节,主讲 OCR 技术导论、文本检测与识别算法的代码实现、OCR 前沿技术的应用及落地。

    为了让知识更好吸收,作者将采用在线 notebook 授课,实时跑代码验证思路,并配套多种难度的代码实践题,给你不一样的学习体验。通过这一课程,你将了解到 #OCR 完整技术栈。搞懂主流 OCR 算法的同时,还能独立实现对应代码,满足常见 OCR 场景需求。

    目前课程还在更新当中
  6. #OCR #表单标注 #工具 ( OCR Form Labeling Tool )(第三方评测)
    这是一个开源的表单标记工具,该工具是为Form Recognizer项目而开发的,Form Recognizer 是表单ORC测试工具集 (Form OCR Test Toolset, FOTT) 的一部分。

    本仓库的目的是开发并维护和微软表单识别和OCR服务相关的多种工具。目前,表单标注工具是首个发布到本仓库的工具。用户可以提供反馈并根据自己的需求做定制化改动。微软Azure表单识别团队将定期更新源代码。如果你希望参与此项目,请参考下文的参与贡献一节。

    FOTT 的标注工具是一个由 React + Redux 开发的 Web 应用程序, 该项目使用 Typescript 语言开发。本项目使用 Create React App 启动。

    当前标注工具具有下面这些特性:
    标注 PDF、JPEG、TIFF等文档格式里的表单。
    通过 Form Recognizer 和标注数据来训练 模型。
    使用训练模型预测上述文档里的单张表单,进而从中提取表单里的 key/value 数据。