Awesome-Multimodal-Memory:专注于多模态记忆增强研究的阅读清单。它能帮助研究人员快速了解多模态领域中记忆机制的最新进展,无论是音频、视频还是视觉机器人,都能找到前沿的解决方案

涵盖三大领域,包括多模态上下文建模、视觉与机器人中的记忆应用,以及外部知识增强;涉及多种模态,如音频、视频、图像和3D数据;提供丰富的研究资源,包含400+篇相关文献
PipelineRL:一个可扩展的异步强化学习实现,能够在运行中更新权重,最大化GPU利用率,同时尽可能保持策略更新的实时性。

支持单节点和多节点部署,灵活适应不同硬件配置;提供文件系统和Redis两种数据流方式,可根据需求选择;仅需8个H100 GPU即可运行单节点实验,入门门槛低
Chatlog:轻松管理你的聊天记录。这个工具能帮助你快速获取和使用自己的聊天数据,无论是查询历史聊天还是提取重要信息,都能轻松搞定。| #工具

支持多平台(Windows、macOS)和多版本微信(3.x/4.0);2. 提供HTTP API和MCP SSE协议支持,无缝对接AI助手;自动解密数据,简化操作流程
DeepWiki:为GitHub仓库提供免费且实时更新的百科全书式文档。

已索引30,000+个仓库;处理超过40亿行代码;提供深度问答和代码解析,帮助开发者快速理解项目
Sapphire:为macOS打造的下一代Rust语言包管理器,用更高效的方式管理你的软件包。

支持并行下载和安装,大幅提升速度;自动依赖解析,安装过程更省心;初步支持从源代码构建Formula,提供更多灵活性
Suna:开源全能AI助手,用自然对话帮你搞定复杂任务。

浏览器自动化,轻松提取网页数据;文件管理与编辑,高效处理文档;无缝集成API,支持多种服务
Open Codex:一款开源的命令行AI助手,无需API即可在本地运行语言模型,轻松将自然语言转换为命令行指令。

支持本地运行,无需联网,保护隐私;一键安装,支持macOS、Linux和Windows;确认后执行,避免误操作
hail-hydrant/zxc:基于终端的拦截代理Agent,用Rust编写,搭配tmux和vim作为用户界面,为网络安全测试和开发提供强大工具。

使用tmux和vim作为界面,熟悉的操作体验;支持http/1.1和websocket协议,功能全面;自定义http/1.1解析器,可发送畸形请求,满足特殊测试需求
ElatoAI:基于OpenAI实时API和ESP32的AI语音交互项目,让智能设备轻松实现全球实时对话。

实现超过10分钟的不间断实时对话;使用Opus音频编码,音频质量高且带宽占用低;全球低延迟边缘计算支持,确保流畅交互
Media is too big
VIEW IN TELEGRAM
create-agent-app:帮你轻松选择AI Agent框架,一站搞定

提供多种框架示例,覆盖7大主流AI框架;统一测试场景,方便对比框架优劣;丰富的Agent示例,涵盖多种实用场景
Describe Anything:让图像和视频描述变得前所未有的详细和精准

仅需在视频中的一帧上标注,即可生成整个视频的详细描述;支持多种输入方式,如点、框、涂鸦和掩码;提供OpenAI兼容API,方便集成到现有系统
Rowboat:AI驱动的多Agent构建器,让复杂工作流的开发变得轻而易举。

仅需几分钟即可从想法生成完整的多Agent工作流;支持快速连接MCP服务器,无缝集成工具;提供强大的HTTP API和Python SDK,方便集成到任何应用
Back to Top