文档解析总是让人头大:PDF结构复杂,格式多样,提取内容费时费力。
MinerU 是一个开源项目,专注于将复杂文档(尤其是PDF)快速高效转成机器可读的Markdown或JSON格式,方便后续用大模型处理和自动化工作流。
它不仅支持排版结构分析、公式识别、表格解析,还能自动去除页眉页脚、脚注,保证语义连贯。更有OCR支持,能处理扫描版PDF,覆盖84种语言。
亮点功能:
- 领先的布局分析和文本识别,支持多栏复杂格式;
- 自动公式转LaTeX,表格转HTML,方便科研文档处理;
- 支持文档录入OCR,适配扫描和乱码PDF;
- 多平台适用,支持CPU和GPU加速;
- 提供在线演示、API接口和本地部署多种使用方式。
MinerU 是一个开源项目,专注于将复杂文档(尤其是PDF)快速高效转成机器可读的Markdown或JSON格式,方便后续用大模型处理和自动化工作流。
它不仅支持排版结构分析、公式识别、表格解析,还能自动去除页眉页脚、脚注,保证语义连贯。更有OCR支持,能处理扫描版PDF,覆盖84种语言。
亮点功能:
- 领先的布局分析和文本识别,支持多栏复杂格式;
- 自动公式转LaTeX,表格转HTML,方便科研文档处理;
- 支持文档录入OCR,适配扫描和乱码PDF;
- 多平台适用,支持CPU和GPU加速;
- 提供在线演示、API接口和本地部署多种使用方式。
Claude Code Templates 是一个开源CLI工具,提供了丰富的预设配置和插件集,帮你快速搭建和管理AI开发环境。
功能亮点:
- 丰富的AI专属agent,如安全审计、性能优化、数据库设计等
- 自定义命令支持,轻松生成测试、优化代码、检查安全
- 集成多种外部服务(GitHub、PostgreSQL、Stripe、AWS等)
- 灵活配置Claude Code的运行参数和自动化钩子
- 超过100个模板和组件,覆盖多种开发场景
- 实时性能监控和会话跟踪,支持远程安全访问
- 健康诊断工具,保障环境稳定高效运行
安装简单,命令交互式浏览和安装,适合AI开发者和团队使用。
搜索信息总是被广告和大量无关结果淹没?想要更智能、更隐私的搜索体验?
Perplexica 是一款开源的 AI 驱动搜索引擎,灵感源自 Perplexity AI,但完全开源且免费。它结合了先进的机器学习技术和 SearxNG 元搜索引擎,实时抓取最新内容,理解你的问题,给出精准且带来源引用的答案。| #搜索引擎
核心功能包括:
- 支持本地多种大语言模型(Qwen、DeepSeek、Llama、Mistral等)
- 两种搜索模式:普通模式和智能辅助查询模式(Copilot,开发中)
- 六种专注模式,覆盖写作辅助、学术论文、YouTube视频、计算分析、Reddit讨论等场景
- 实时信息更新,避免过时数据困扰
- 提供API,方便集成到其他应用
- 支持多平台,Docker一键部署超方便
适合开发者、研究者以及所有追求高效搜索体验的用户。
Perplexica 是一款开源的 AI 驱动搜索引擎,灵感源自 Perplexity AI,但完全开源且免费。它结合了先进的机器学习技术和 SearxNG 元搜索引擎,实时抓取最新内容,理解你的问题,给出精准且带来源引用的答案。| #搜索引擎
核心功能包括:
- 支持本地多种大语言模型(Qwen、DeepSeek、Llama、Mistral等)
- 两种搜索模式:普通模式和智能辅助查询模式(Copilot,开发中)
- 六种专注模式,覆盖写作辅助、学术论文、YouTube视频、计算分析、Reddit讨论等场景
- 实时信息更新,避免过时数据困扰
- 提供API,方便集成到其他应用
- 支持多平台,Docker一键部署超方便
适合开发者、研究者以及所有追求高效搜索体验的用户。
OpenAI 出品的 Codex CLI 是一款轻量级的本地编码助手,直接在终端运行,帮你快速生成代码片段、自动补全和调试,极大提升开发效率。
- 支持多种编程语言和框架,适配各种开发场景;
- 通过命令行即可调用,安装简单,npm 或 Homebrew 一键搞定;
- 可结合 ChatGPT 账户使用,享受 Plus、Pro 等多种计划的智能辅助;
- 支持丰富配置,满足高级用户个性化需求;
- 还提供 API 访问模式,方便集成到 CI/CD 流程。