在线智能问答系统,文档上传、向量检索、模型推理一体化,轻松实现本地RAG入门体验。

Local PDF Chat RAG 是一个开源项目,专为想理解并动手实践检索增强生成(RAG)技术的初学者设计。它结合了PDF处理、FAISS向量检索、多模型集成等核心模块,帮助你从源码层面掌握RAG的底层流程。

主要功能:

- 多PDF文档上传与自动文本切割向量化
- 本地FAISS向量数据库构建与高效语义检索
- 混合BM25关键词检索提升召回率
- 交叉编码器及大模型(支持本地 Ollama 和云端 SiliconFlow)结果重排序
- 支持联网搜索增强回答的时效性(需配置SerpAPI密钥)
- 递归式深度检索,自动生成新查询,提升答复深度
- Gradio交互式Web UI,操作简单直观
- 本地化优先,保护数据隐私

适合科研、开发者和RAG技术爱好者快速上手,理解RAG的全流程细节。
在线资金费率套利总是要盯着多个交易所的费率和价格变动,手动监控费时费力,执行交易还容易错过最佳时机。

bphltaoli 是一款开源的加密货币资金费率套利机器人,支持Hyperliquid和Backpack两个主流交易所。它能实时监控资金费率和价格差异,自动执行智能套利策略,帮你捕捉稳定收益。

主要功能:

- 多交易所实时连接,数据同步高效;
- 自动套利策略,基于资金费率和价格差异智能开平仓;
- 风险管理完善,支持仓位控制和滑点分析;
- 方向一致性检查,确保套利交易安全可靠;
- 详细日志记录,方便策略回溯和调试;
- 支持Python环境,跨平台运行。

适合有一定交易基础的数字货币投资者和量化爱好者,用代码化的方式抓住资金费率套利机遇,降低手动操作风险,实现自动化交易收益最大化。
在线机器人操作领域,视觉-语言-动作(VLA)模型正快速发展,整合了视觉感知、语言理解和动作控制,推动智能机器人向更通用、灵活的方向迈进。

VLAs 项目汇总了最新的视觉语言动作模型、数据集、基准测试代码与模拟器,帮助科研人员系统了解和评估前沿成果,覆盖导航、抓取、多机器人协作等多种任务。

核心内容包括:
- 多样化VLA模型和对应论文链接,追踪年度研究进展;
- 大规模、多模态数据集,支持训练与评估;
- 任务复杂度与模态丰富度的基准测试代码;
- 主流机器人仿真平台资源一览,助力数据生成和算法验证。

适合机器人、人工智能和多模态学习方向的开发者与研究者,助力打造更智能的机器人操作系统。
在线寻找音乐资源总是要翻遍各大平台,下载工具、播放器、歌词插件……太多分散工具使用起来很麻烦。

Music Megathread 是一个超全的音乐资源合集,汇集了免费音乐播放器、多平台下载器、流媒体客户端、歌词工具、音乐识别和管理软件,甚至还有Telegram音乐机器人,帮你轻松玩转音乐世界。

不仅支持 Spotify、YouTube Music、Deezer 等主流平台,还覆盖离线播放器、音频编辑、曲库管理、音效合成等丰富功能,满足各种音乐需求。| #音乐

核心亮点:

- 多平台音乐播放器和下载工具,支持Windows、macOS、Linux、Android、iOS;
- 丰富的 Spotify 和 YouTube Music 客户端及辅助工具,解锁更多功能;
- 在线与离线音乐管理、编辑、歌词同步与显示,一站式解决方案;
- 海量音乐识别与元数据编辑工具,方便整理个人音乐库;
- 全面支持音频录制、合成、转换、编辑,适合音乐制作爱好者;
- 集成多种Telegram音乐机器人,聊天中也能轻松找歌听歌。

适合音乐爱好者、音乐制作人、DJ、音频发烧友,帮你更高效地发现、管理和享受音乐。
在线管理邮箱和提醒,常常需要多个工具配合,切换起来很麻烦。

OpenPoke 是一个开源项目,灵感来源于 Interaction Company 的 Poke 助手,实现了多智能体协同的邮件管理和提醒功能,方便用户快速处理邮件和设置提醒,且支持本地快速部署。

主要特色:

- 多智能体 FastAPI 后端,分离交互和执行逻辑;
- 集成 Gmail 草稿、回复、转发功能,免离开聊天界面操作邮件;
- 支持提醒调度和重要邮件监控,自动推送消息;
- 基于 Next.js 的 Web 界面,一键配置 API,简单易用;
- 完全开源,可本地运行,自定义灵活。

适合需要高效邮箱管理和智能提醒的个人及团队使用。
Agentic RAG:AI工程师必知的进阶检索生成框架

简单的RAG(Retrieval-Augmented Generation)系统很少直接用在实际场景。现实中,我们通常会给RAG加上“智能代理”(Agentic)能力,且尽量保持简洁。

没有放之四海皆准的方案,RAG系统必须根据具体业务灵活调整。理解Agentic RAG的关键组成,有助你设计适合自己的方案:

1️⃣ 用户查询分析
- 由基于大模型(LLM)的智能代理分析原始查询,可能重写或拆分成多条查询。
- 判断是否需要额外数据源。

2️⃣ 触发检索
- 若需更多数据,智能代理负责确定应调用哪些数据源,如实时用户数据、内部文档、网络信息等。

3️⃣ 数据整合与重排序
- 用更强的模型对检索结果进行筛选和重排名,大幅缩小信息范围。

4️⃣ 无需额外数据时,直接由LLM生成答案或执行多步动作。

5️⃣ 答案评估与循环优化
- 智能代理评判答案的准确性和相关性。
- 不达标时重新改写查询,重复生成,循环次数有限制。

💡 经验分享:
- 尽量简化流程,很多场景不需全部环节即可满足需求。
- 数据预处理和重排序环节是关键,覆盖90%以上应用。
- Agentic系统远超传统RAG,不只是问答,更能自动执行后续动作,未来会有更多分享,敬请关注!

Agentic RAG的核心在于“智能代理”的灵活决策能力,真正实现从理解用户意图到智能调取数据,再到动态生成和校验答案的全流程闭环。相比传统RAG,Agentic RAG更适合复杂业务场景,尤其是需要自动化执行操作的企业应用。未来AI系统的发展趋势将是“理解+检索+行动”的深度融合,而不仅仅是回答问题。
TimesFM 2.5:一款专为时间序列预测打造的预训练模型,开箱即用,零样本表现出色:

- 参数量缩减至2亿(原500M),更轻量
- 上下文长度提升至16k(原2k),适合长序列
- 已开源发布于 Hugging Face,Apache 2.0 许可
- 兼顾高性能与实用性,适合各种时间序列任务

这是时间序列预测领域的一个重要进步。传统时间序列模型在噪声较大的实际数据表现常常不尽如人意,复杂模型也难以达到预期。TimesFM 2.5通过大规模数据和更长上下文,展现了深度学习在这类任务中的潜力,尽管挑战依旧存在。

未来,结合更多数据和更强模型结构,时间序列预测有望突破更多应用场景,如经济预测、设备维护、气象分析等。期待社区的持续测试和反馈,推动模型不断进步。
在线AI推理验证常常面临效率低和隐私泄露的难题,传统方案无法兼顾速度与数据安全。

DeepProve 是一个前沿的零知识机器学习推理框架,专注于用零知识证明技术快速验证神经网络推理结果,且无需暴露任何输入数据。无论是多层感知机(MLP)还是卷积神经网络(CNN),DeepProve都能做到高效且安全。| #框架

主要特点:

- 利用先进的加密算法如sumchecks和logup GKR,实现次线性证明时间;
- 在CIFAR-10数据集上的CNN模型推理速度提升158倍,4百万参数的密集模型提升54倍;
- 支持多层神经网络推理的零知识证明,验证过程快速且轻量;
- 适用于数据隐私要求高的场景,如医疗、金融和区块链中的AI模型可信计算;
- 开源且多许可协议(Apache-2.0 + MIT)保障自由使用。
线图像编辑一直面临身份一致性难题,不同风格、多任务的编辑容易导致人物特征混乱,影响视觉体验。

Nano-consistent-150k 是基于 Nano-Banana 构建的首个超15万高质量合成数据集,专门设计来保持复杂编辑场景下的人物身份一致性。

核心亮点:

- 单个人像配备35+种不同编辑输出,覆盖多任务和多指令;
- 通过一致的人物身份锚点,实现多任务、多模态编辑的无缝衔接;
- 支持多样化复杂场景下的高保真图像生成和编辑;
- 附带全套训练代码和评测基准,方便研究者复现和拓展。

适合视觉生成、图像编辑、合成数据研究和多任务模型训练,推动高质量图像合成和跨任务一致性研究迈上新台阶。
在线机器人强化学习研究环境常常需要结合高性能物理引擎与便捷API,但市面方案往往复杂且依赖繁多。

mjlab 是一个基于 MuJoCo-Warp 的 Isaac Lab API 轻量级开源项目,专为机器人强化学习和 sim-to-real 部署设计,极大简化了仿真开发流程。

它支持 GPU 加速的并行物理仿真,启动快速且易调试,且依赖极少,纯 Python 环境即可运行。

主要功能:

- 兼容 Isaac Lab 和 MuJoCo 的熟悉 API,快速上手;
- 基于 MuJoCo-Warp 的高效 GPU 加速大规模物理仿真;
- 即时调试支持,启动快且内核缓存机制;
- 纯 Python 实现,依赖极少,方便集成和部署;
- 提供多种机器人强化学习训练示例,支持多环境并行训练;
- 支持从 Isaac Lab 平滑迁移,配备详细文档和常见问题解答。

适合机器人学、强化学习领域科研人员和工程师使用,助力快速构建高效仿真训练环境。
Back to Top