黑洞资源笔记
- openai-realtime-streamlit:将OpenAI的实时对话控制台移植到Streamlit,实现更直观的交互体验,支持音频流的发送和播放
- AkiraDocs:智能文档平台,能够自动编写、翻译和优化文档,让团队专注于创意而非文档管理的复杂性
- 一个高性能的非结构化数据提取工具,使用Rust编写并支持多种编程语言。
特色是速度快(比unstructured-io快25倍)、内存占用低、支持本地运行,无需依赖外部服务。支持PDF、Word、HTML等多种文档格式的文本和元数据提取,集成OCR功能,适用于数据处理管道和RAG应用场景。
Extractous | #工具 - ChibiHash:轻量级、快速、可移植的64位哈希函数。特点是代码量小(约65行C代码)、运行速度快(大文件处理速度24.20 GiB/s)、跨平台兼容性好(不依赖硬件指令)。通过了smhasher和smhasher3测试,适合作为非加密场景下的默认哈希函数选择
- awesome-mir-labs:一个全面收录音乐信息检索(MIR)和AI音乐实验室的资源列表。收录了全球各地活跃的MIR研究机构,包括各实验室的所属机构、地区、负责人和研究方向等详细信息。对想要从事音乐AI研究的学者和学生提供了重要的参考价值
- knowledge-graph-studio:一个开源的知识图谱构建和管理平台,专为RAG应用设计。支持基于规则的实体解析、模块化图谱构建、灵活的数据接入等功能。基于NoSQL数据库构建,提供API优先的设计理念和SDK支持,可用于构建动态的图谱驱动AI工作流,适用于实验性和大规模应用场景
- s3-log:一个基于S3构建的分布式、持久化、高可用的日志系统。利用Amazon S3的存储能力来实现可靠的日志存储和管理,为分布式系统提供稳定的日志解决方案。目前项目仍在开发中(WIP),不建议用于生产环境
-
- MLX Omni Server:一款基于苹果MLX框架的本地推理服务器,专为Apple Silicon芯片优化设计。
支持OpenAI兼容的API接口,实现文本对话、语音转换、图像生成等AI能力。
特点是本地化推理保护隐私、硬件加速高性能、支持OpenAI SDK直接调用,可作为OpenAI API的本地替代方案 - 一款轻量级的浏览器数据库图形界面工具,支持多种主流数据库(包括SQLite、PostgreSQL、MySQL等)。主要特点包括智能查询编辑器、数据编辑器、模式编辑器和连接管理器。具有自动完成、多查询并行执行、高效渲染等功能,提供Windows和Mac桌面版本
Outerbase Studio | #工具 - awesome-machine-learning-startups:一个全球AI和机器学习创业公司的精选列表,按城市和领域分类整理。涵盖计算机视觉、自然语言处理、机器人、医疗、自动驾驶等多个AI应用领域,包含公司基本信息、LinkedIn链接、融资状态等详细数据
- 用于在DuckDB中直接通过SQL读写Google Sheets的扩展工具。支持通过URL或spreadsheet ID访问表格,可以读取指定sheet页面,支持无表头读取,还可以直接将数据写入到Google Sheets中。提供浏览器认证和访问令牌两种认证方式
DuckDB GSheets | #工具 -
-
-
-