文档解析总是让人头大:PDF结构复杂,格式多样,提取内容费时费力。
MinerU 是一个开源项目,专注于将复杂文档(尤其是PDF)快速高效转成机器可读的Markdown或JSON格式,方便后续用大模型处理和自动化工作流。
它不仅支持排版结构分析、公式识别、表格解析,还能自动去除页眉页脚、脚注,保证语义连贯。更有OCR支持,能处理扫描版PDF,覆盖84种语言。
亮点功能:
- 领先的布局分析和文本识别,支持多栏复杂格式;
- 自动公式转LaTeX,表格转HTML,方便科研文档处理;
- 支持文档录入OCR,适配扫描和乱码PDF;
- 多平台适用,支持CPU和GPU加速;
- 提供在线演示、API接口和本地部署多种使用方式。
MinerU 是一个开源项目,专注于将复杂文档(尤其是PDF)快速高效转成机器可读的Markdown或JSON格式,方便后续用大模型处理和自动化工作流。
它不仅支持排版结构分析、公式识别、表格解析,还能自动去除页眉页脚、脚注,保证语义连贯。更有OCR支持,能处理扫描版PDF,覆盖84种语言。
亮点功能:
- 领先的布局分析和文本识别,支持多栏复杂格式;
- 自动公式转LaTeX,表格转HTML,方便科研文档处理;
- 支持文档录入OCR,适配扫描和乱码PDF;
- 多平台适用,支持CPU和GPU加速;
- 提供在线演示、API接口和本地部署多种使用方式。
Claude Code Templates 是一个开源CLI工具,提供了丰富的预设配置和插件集,帮你快速搭建和管理AI开发环境。
功能亮点:
- 丰富的AI专属agent,如安全审计、性能优化、数据库设计等
- 自定义命令支持,轻松生成测试、优化代码、检查安全
- 集成多种外部服务(GitHub、PostgreSQL、Stripe、AWS等)
- 灵活配置Claude Code的运行参数和自动化钩子
- 超过100个模板和组件,覆盖多种开发场景
- 实时性能监控和会话跟踪,支持远程安全访问
- 健康诊断工具,保障环境稳定高效运行
安装简单,命令交互式浏览和安装,适合AI开发者和团队使用。
搜索信息总是被广告和大量无关结果淹没?想要更智能、更隐私的搜索体验?
Perplexica 是一款开源的 AI 驱动搜索引擎,灵感源自 Perplexity AI,但完全开源且免费。它结合了先进的机器学习技术和 SearxNG 元搜索引擎,实时抓取最新内容,理解你的问题,给出精准且带来源引用的答案。| #搜索引擎
核心功能包括:
- 支持本地多种大语言模型(Qwen、DeepSeek、Llama、Mistral等)
- 两种搜索模式:普通模式和智能辅助查询模式(Copilot,开发中)
- 六种专注模式,覆盖写作辅助、学术论文、YouTube视频、计算分析、Reddit讨论等场景
- 实时信息更新,避免过时数据困扰
- 提供API,方便集成到其他应用
- 支持多平台,Docker一键部署超方便
适合开发者、研究者以及所有追求高效搜索体验的用户。
Perplexica 是一款开源的 AI 驱动搜索引擎,灵感源自 Perplexity AI,但完全开源且免费。它结合了先进的机器学习技术和 SearxNG 元搜索引擎,实时抓取最新内容,理解你的问题,给出精准且带来源引用的答案。| #搜索引擎
核心功能包括:
- 支持本地多种大语言模型(Qwen、DeepSeek、Llama、Mistral等)
- 两种搜索模式:普通模式和智能辅助查询模式(Copilot,开发中)
- 六种专注模式,覆盖写作辅助、学术论文、YouTube视频、计算分析、Reddit讨论等场景
- 实时信息更新,避免过时数据困扰
- 提供API,方便集成到其他应用
- 支持多平台,Docker一键部署超方便
适合开发者、研究者以及所有追求高效搜索体验的用户。
OpenAI 出品的 Codex CLI 是一款轻量级的本地编码助手,直接在终端运行,帮你快速生成代码片段、自动补全和调试,极大提升开发效率。
- 支持多种编程语言和框架,适配各种开发场景;
- 通过命令行即可调用,安装简单,npm 或 Homebrew 一键搞定;
- 可结合 ChatGPT 账户使用,享受 Plus、Pro 等多种计划的智能辅助;
- 支持丰富配置,满足高级用户个性化需求;
- 还提供 API 访问模式,方便集成到 CI/CD 流程。
Maxime Rivest 分享了用两条命令让 Claude Code 完美接入浏览器的秘诀:| 推文
1️⃣ 启动 Chrome 浏览器(自定义用户数据目录,避免使用默认配置,保持登录状态)
google-chrome --remote-debugging-port=9222 --user-data-dir="$HOME/.config/my-mcp-chrome-profile"2️⃣ 安装连接浏览器的 MCP 服务
claude mcp add chrome-devtools -- npx -y chrome-devtools-mcp﹫latest -u这样,你就可以用自然语言指挥 AI 在浏览器里做任何事,远超 Puppeteer、Playwright,甚至可以做网络请求、抓取XHR、自动点击元素等复杂操作。
- DevTools MCP 能完整访问 JS 动态内容,支持网络请求重放和数据抓取。
- 通过自定义用户数据目录,解决登录状态和权限问题,避免安全隐患。
- 适合自动化任务、数据监控、定时爬取等多场景,未来有潜力成为强大的数据分析平台。
- 需要合理控制上下文读取,避免性能瓶颈。
- 社区也有类似 DeepWiki MCP,可针对 GitHub 公共仓库提问,拓展更多用途。
当然,使用时要权衡安全风险,谨慎管理浏览器登录信息,避免泄露。
这套方案让浏览器自动化变得更智能、更自然、更强大,值得开发者深度探索。