Skip to main content

黑洞资源笔记

  1. 一个多模态工具,用于将现实世界的信息输入大语言模型,基于多核设计,通过精心设计的启发式方法,从文件、文件夹、网页等来源创建有意义的文本和图像提示。

    The Pipe | #工具
  2. WhatTheDuck:一个基于 DuckDB 构建的开源 Web 应用程序,旨在允许用户上传 CSV 文件,将其存储在表中,并对上传的数据执行 SQL 查询。

    该应用程序还提供以 CSV 格式下载过滤结果的功能,支持上传多个文件,并使用户能够执行联接查询。

    需要注意的是,应用程序将数据临时存储在内存中,刷新页面会清除所有上传的数据。
  3. 一款可助你轻松创作高质量文章的 AI 工具 Claude-Journalist | #工具

    该工具借助了 Claude 3,只需输入一个主题,它便会通过网络搜索收集相关信息,并帮你进行撰写和编辑高质量的文章。

    你可以在 Colab 笔记上运行它开源的 .ipynb 文件,也可以在其自家平台上使用。

    工作流程:

    1. 用户输入一个写作主题;
    2. 利用 Claude 3 Haiku 为该主题生成一系列搜索关键词;
    3. 通过 SERP API 对这些关键词进行网络搜索;
    4. Claude 将从搜索结果中挑选出最贴切、信息量最丰富的网页链接;
    5. 利用 newspaper3k 库提取这些链接的文章内容;
    6. Claude 基于这些内容撰写一篇高品质文章;
    7. Claude 还将作为编辑,审阅文章并提出改进建议;
    8. 根据这些建议,Claude 将文章重写;
    9. 最后展示出初稿和经过编辑的文章。
  4. Lapdev:自托管远程开发环境管理系统,可以在服务器或云服务器上建立和管理远程开发环境

    轻松实现自助托管: Lapdev 可自行托管,安装和维护工作量极小。应用程序只需运行即可,无需深入内部排除故障。

    横向可扩展性: Lapdev 采用简单而强大的架构,可从单台机器扩展到整个服务器群,因此你可以拥有一个与开发团队共同成长的开发环境管理系统。

    开发环境即代码: 通过使用 Devcontainer 开放规范,Lapdev 允许你将开发环境定义为代码。这样就可以将开发环境标准化,并在不同的开发人员之间进行复制,从而避免与环境相关的问题,确保每个人都能获得一致的设置。

    节省入职时间: 新项目的入职开发人员无需花费数小时或数天的时间在自己的机器上准备环境。他们可以立即开始编码。
  5. CoML:可以帮助数据科学和机器学习开发人员的开源项目,基于大型语言模型提供交互式自然语言编程接口,方便数据分析和机器学习任务
  6. TorchTune:易于使用的 PyTorch 库,可轻松编写、微调和实验LLM模型。

    该库提供了多种功能,包括使用 native-PyTorch 实现的流行语言模型,支持各种格式的复原,以及提供训练和评估工具,例如 HF 格式的检查点支持。
  7. Devika:基于开源的 AI 软件工程师,可以理解人类的高级指令,并根据这些指令,分解成步骤,进行相关信息的研究,并编写代码实现目标。

    Devika的系统架构由以下关键组件组成:

    用户界面:基于网络的聊天界面,用于与 Devika 交互、查看项目文件以及监控代理的状态。
    Agent Core:编排AI规划、推理和执行过程的核心组件。它与各种子代理和模块通信以完成任务。
    大型语言模型:Devika 利用Claude、GPT-4和Ollama 的本地 LLM等最先进的语言模型进行自然语言理解、生成和推理。
    规划和推理引擎:负责将高层目标分解为可操作的步骤,并根据当前环境做出决策。
    研究模块:利用关键字提取和网页浏览功能来收集当前任务的相关信息。
    代码编写模块:根据计划、研究结果和用户需求生成代码。支持多种编程语言。
    浏览器交互模块:使 Devika 能够根据需要导航网站、提取信息并与 Web 元素交互。
    知识库:存储和检索项目特定信息、代码片段和学到的知识,以便高效访问。
    数据库:保存项目数据、代理状态和配置设置。