Skip to main content

黑洞资源笔记

  1. 哔哩哔哩字幕列表是一个浏览器扩展,旨在提供更高效和可控的视频信息获取方式。

    该扩展会显示视频的字幕列表,让用户能够快速浏览字幕内容,并通过点击跳转到相应的视频位置。
    除此之外,该扩展还提供了视频字幕总结、翻译功能,帮助用户快速掌握视频的要点。
    该扩展主要面向知识学习类的视频,帮助用户更好地理解和总结视频内容。

    功能特点
    🎬 显示视频的字幕列表
    🔗 点击字幕跳转视频对应位置
    📥 多种格式复制与下载字幕
    📝 多种方式总结字幕
    🌍 翻译字幕
    🌑 深色主题

    扩展下载 | bilibili-subtitle | #扩展
  2. 如何构建 Supabase 的 OpenAI 文档搜索(嵌入)

    ClippyGPT是Supabase下一代文档搜索工具,你可以向Clippy询问任何有关Supabase的问题,它将使用自然语言进行回答。这一切都得益于OpenAI和提示工程。

    视频覆盖以下内容:
    - Prompt工程和最佳实践
    - 通过上下文注入 + OpenAI嵌入来处理自定义知识库
    - 如何使用pgvector在Postgres中存储嵌入

    Supabase博客 | YouTube | #工具
    Media is too big
    VIEW IN TELEGRAM
  3. GPT prompt技巧,回忆法

    有时直接叫GPT编程,它返回的结果并不理想。但你可以先跟它聊会天,叫它回忆一下,看它知不知道这整个过程怎么实现,最后再说一句”请综合上述回答,用xxx编一个xxxx程序“,这样就会好非常多。

    如图里给的这个例子中,如果你直接叫它用matlab画一个高分子共混的相图,它连自由能表达式都会写错。

    但如果先叫口述一下这个过程,发现它居然基本都是对的。但求化学势部分有点问题,所以,我让它用另一种方法求相平衡线。

    最后,才叫它编程,此时,编出来的程序就可靠多了。(来源见图片水印)
  4. 一个开源的向量数据库,支持JavaScript和Python,并且可以方便的和Langchain集成。

    主要功能包括:
    - 存储向量和它们的元数据
    - 文档向量和对向量查询
    - 从数据库中检索相似的向量

    用Python的话 ,它可以以内存数据库方式运行,或者是客户端/服务端运行。
    用JavaScript的话,目前仅支持客户端连接Python的服务端或者Docker。

    文档 | 主页
  5. Google的教学视频《Introduction to Large Language Models | 大语言模型介绍》,介绍了大型语言模型(Large Language Models,LLMs)的概念、使用场景、提示调整以及Google的Gen AI开发工具。

    大型语言模型是深度学习的一个子集,可以预训练并进行特定目的的微调。这些模型经过训练,可以解决诸如文本分类、问题回答、文档摘要、跨行业的文本生成等常见语言问题。然后,可以利用相对较小的领域数据集对这些模型进行定制,以解决零售、金融、娱乐等不同领域的特定问题。

    大型语言模型的三个主要特征是:大型、通用性和预训练微调。"大型"既指训练数据集的巨大规模,也指参数的数量。"通用性"意味着这些模型足够解决常见问题。"预训练和微调"是指用大型数据集对大型语言模型进行一般性的预训练,然后用较小的数据集对其进行特定目的的微调。

    使用大型语言模型的好处包括:一种模型可用于不同的任务;微调大型语言模型需要的领域训练数据较少;随着数据和参数的增加,大型语言模型的性能也在持续增长。

    此外,视频还解释了传统编程、神经网络和生成模型的不同,以及预训练模型的LLM开发与传统的ML开发的区别。

    在自然语言处理中,提示设计和提示工程是两个密切相关的概念,这两者都涉及创建清晰、简洁、富有信息的提示。视频中还提到了三种类型的大型语言模型:通用语言模型、指令调整模型和对话调整模型。每种模型都需要以不同的方式进行提示。
    Media is too big
    VIEW IN TELEGRAM
  6. “这个仓库是用来收集左耳朵耗子(陈皓, github ID haoel) 的一些点滴,您如果认识陈皓, 或曾经和陈皓打过交道,欢迎您通过PR来写出您和陈皓的故事。

    我们会用这些您和陈皓生前的精彩片段记录成精美的手册,转交到陈皓的小孩手中, 我们希望让陈皓的小孩知道他有一个出色的且令人尊敬的父亲, 希望他也能成为一位像他父亲那样的人。

    每个PR 中需要包含一个唯一的目录名,目录名建议就以PR提供者的GithubID 命名, 在目录下需要一个名为 Memory.MD 的Markdown文件或一些图片, 如果有图片,请做好相对路径的图片引用链接。

    PR一旦被接受,我们会更新ReadME中的Index 以方便快速索引到您和陈皓的故事。”

    Remembering-Haoel