黑洞资源笔记

Chandra OCR开源发布，具备强大功能和广泛应用潜力：

- 支持完整版面信息解析，能识别并标注图片、图表
- 优秀的手写体、表格和表单识别能力
- 兼容transformers和vLLM架构，易于集成和扩展

获取方式：
Huggingface仓库 | Github代码库 | 在线演示体验（推荐平衡模式）
通过Datalab API调用，支持balanced和accurate两种模式

快速上手：

pip install chandra-ocr chandra_vllm
chandra input.pdf ./output

性能与对比：
- 在olmocr基准测试中优于Deepseek OCR，展现出更高准确率
- 相较Marker OCR，Chandra更擅长复杂格式和整体排版，但速度稍慢
- 支持多语言（基于Surya语言支持），但对部分低资源语言仍有提升空间

已知限制：
- 纯数学公式识别尚不及Marker
- 旋转页面识别准确度下降
- 部分低资源语言效果欠佳

未来计划：
- 持续优化模型精度和性能
- 量化与加速支持，提升推理速度
- 扩展语言和用例覆盖