在线文档解析往往需要多阶段复杂流程,特别是科学论文、化学结构、手写公式等内容解析难度大。

阿里开源的 Logics-Parsing 是一款基于视觉语言模型(VLM),通过监督微调和强化学习打造的端到端文档解析模型,能准确理解和结构化复杂布局与 STEM 内容。

它支持从图片直接解析成结构化 HTML,自动识别段落、表格、公式、图像等内容块,甚至能智能识别化学结构并导出 SMILES 格式。

主要功能:

- 一步到位解析复杂文档,无需多阶段流水线;
- 精准识别科学公式、化学结构、手写文本等难点内容;
- 生成结构化且干净的 HTML 输出,保留逻辑与位置信息;
- 自动过滤页眉页脚,专注核心内容;
- 在自研复杂文档解析基准测试中表现领先。

适合科研文献、化学资料、手写笔记等复杂文档的智能解析需求。
在线使用 Unity 做游戏开发,AI 助手能帮你自动化编辑、管理资源、控制场景,甚至写代码,这听起来是不是很酷?

Unity MCP 是一个开源项目,搭建了一个本地服务器,让像 Claude Desktop、Cursor 这样的 AI MCP 客户端直接操控 Unity 编辑器,极大提升开发效率。

主要功能:

- 自然语言指令控制 Unity 编辑器操作;
- 管理脚本、场景、资源、材质和游戏对象;
- 自动化重复工作流程,节省时间;
- 支持多种 MCP 客户端扩展使用;
- 精准脚本编辑和验证,减少代码错误;
- 实时控制菜单项和编辑器状态。

支持 Unity 2021.3 LTS 及以上版本,Python 3.12+ 环境,适合游戏开发者和 AI 工具爱好者。
在线智能问答系统,文档上传、向量检索、模型推理一体化,轻松实现本地RAG入门体验。

Local PDF Chat RAG 是一个开源项目,专为想理解并动手实践检索增强生成(RAG)技术的初学者设计。它结合了PDF处理、FAISS向量检索、多模型集成等核心模块,帮助你从源码层面掌握RAG的底层流程。

主要功能:

- 多PDF文档上传与自动文本切割向量化
- 本地FAISS向量数据库构建与高效语义检索
- 混合BM25关键词检索提升召回率
- 交叉编码器及大模型(支持本地 Ollama 和云端 SiliconFlow)结果重排序
- 支持联网搜索增强回答的时效性(需配置SerpAPI密钥)
- 递归式深度检索,自动生成新查询,提升答复深度
- Gradio交互式Web UI,操作简单直观
- 本地化优先,保护数据隐私

适合科研、开发者和RAG技术爱好者快速上手,理解RAG的全流程细节。
在线资金费率套利总是要盯着多个交易所的费率和价格变动,手动监控费时费力,执行交易还容易错过最佳时机。

bphltaoli 是一款开源的加密货币资金费率套利机器人,支持Hyperliquid和Backpack两个主流交易所。它能实时监控资金费率和价格差异,自动执行智能套利策略,帮你捕捉稳定收益。

主要功能:

- 多交易所实时连接,数据同步高效;
- 自动套利策略,基于资金费率和价格差异智能开平仓;
- 风险管理完善,支持仓位控制和滑点分析;
- 方向一致性检查,确保套利交易安全可靠;
- 详细日志记录,方便策略回溯和调试;
- 支持Python环境,跨平台运行。

适合有一定交易基础的数字货币投资者和量化爱好者,用代码化的方式抓住资金费率套利机遇,降低手动操作风险,实现自动化交易收益最大化。
在线机器人操作领域,视觉-语言-动作(VLA)模型正快速发展,整合了视觉感知、语言理解和动作控制,推动智能机器人向更通用、灵活的方向迈进。

VLAs 项目汇总了最新的视觉语言动作模型、数据集、基准测试代码与模拟器,帮助科研人员系统了解和评估前沿成果,覆盖导航、抓取、多机器人协作等多种任务。

核心内容包括:
- 多样化VLA模型和对应论文链接,追踪年度研究进展;
- 大规模、多模态数据集,支持训练与评估;
- 任务复杂度与模态丰富度的基准测试代码;
- 主流机器人仿真平台资源一览,助力数据生成和算法验证。

适合机器人、人工智能和多模态学习方向的开发者与研究者,助力打造更智能的机器人操作系统。
在线寻找音乐资源总是要翻遍各大平台,下载工具、播放器、歌词插件……太多分散工具使用起来很麻烦。

Music Megathread 是一个超全的音乐资源合集,汇集了免费音乐播放器、多平台下载器、流媒体客户端、歌词工具、音乐识别和管理软件,甚至还有Telegram音乐机器人,帮你轻松玩转音乐世界。

不仅支持 Spotify、YouTube Music、Deezer 等主流平台,还覆盖离线播放器、音频编辑、曲库管理、音效合成等丰富功能,满足各种音乐需求。| #音乐

核心亮点:

- 多平台音乐播放器和下载工具,支持Windows、macOS、Linux、Android、iOS;
- 丰富的 Spotify 和 YouTube Music 客户端及辅助工具,解锁更多功能;
- 在线与离线音乐管理、编辑、歌词同步与显示,一站式解决方案;
- 海量音乐识别与元数据编辑工具,方便整理个人音乐库;
- 全面支持音频录制、合成、转换、编辑,适合音乐制作爱好者;
- 集成多种Telegram音乐机器人,聊天中也能轻松找歌听歌。

适合音乐爱好者、音乐制作人、DJ、音频发烧友,帮你更高效地发现、管理和享受音乐。
在线管理邮箱和提醒,常常需要多个工具配合,切换起来很麻烦。

OpenPoke 是一个开源项目,灵感来源于 Interaction Company 的 Poke 助手,实现了多智能体协同的邮件管理和提醒功能,方便用户快速处理邮件和设置提醒,且支持本地快速部署。

主要特色:

- 多智能体 FastAPI 后端,分离交互和执行逻辑;
- 集成 Gmail 草稿、回复、转发功能,免离开聊天界面操作邮件;
- 支持提醒调度和重要邮件监控,自动推送消息;
- 基于 Next.js 的 Web 界面,一键配置 API,简单易用;
- 完全开源,可本地运行,自定义灵活。

适合需要高效邮箱管理和智能提醒的个人及团队使用。
Back to Top