Skip to main content

黑洞资源笔记

  1. Poppy,一种新的 Bloom 过滤器格式和开源项目

    用rust重写的布隆过滤器。当然重点不是用Rust重写,作者讲了他们在使用传统布隆过滤器时遇到的问题及解决方案
  2. Friend: 开源AI可穿戴设备,可实时分析语音并提供主动反馈和建议

    特征:

    实时 AI 音频处理:利用强大的设备端 AI 功能进行实时音频分析。
    低功耗蓝牙:使用小纽扣电池捕获音频 24 小时以上。
    开源软件:访问 pin 的软件堆栈并为其做出贡献,其设计考虑了开放性和社区协作。
    可穿戴设计:体验无与伦比的便利性,符合人体工程学和轻巧的设计,非常适合日常佩戴。
  3. AIOS: 基于大型语言模型的操作系统,允许操作系统像“具有灵魂”一样运行,AIOS 是一个旨在优化资源分配、促进跨agent上下文切换、实现agent并发执行和提供LLM agent工具服务。
  4. Sycamore:一个对话式搜索和分析平台,适用于复杂的非结构化数据,例如文档、演示文稿、成绩单、嵌入式表格和内部知识存储库。

    它通过将人工智能引入数据准备、索引和检索来检索和综合高质量的答案。 Sycamore 可以轻松准备用于搜索和分析的非结构化数据,提供用于数据清理、信息提取、丰富、汇总和生成封装数据语义的向量嵌入的工具包。

    Sycamore 使用你选择的生成式 AI 模型来使这些操作变得简单而有效,并且可以实现快速实验和迭代。此外,Sycamore 使用 OpenSearch 进行索引,支持混合(向量 + 关键字)搜索、检索增强生成 (RAG) 管道、过滤、分析功能、会话记忆和其他功能来改进信息检索。

    特征
    自然语言、对话界面,可针对非结构化数据提出复杂问题。包括对来源段落和对话记忆的引用。
    包括对非结构化数据的各种查询操作,包括混合搜索、检索增强生成 (RAG) 和分析函数。
    通过高级数据分段、用于数据丰富的 LLM 支持的 UDF、使用 Python 进行的高性能数据操作以及使用各种 AI 模型的向量嵌入,准备和丰富用于搜索和分析的复杂非结构化数据。
    自动数据爬虫(Amazon S3 和 HTTP)和 Jupyter 笔记本支持等有用的功能可用于创建和迭代数据准备脚本。
    可扩展、安全且可定制的 OpenSearch 后端,用于索引和数据检索。