Skip to main content

黑洞资源笔记

  1. 分布式 PostgreSQL 架构概述 | Articles

    这篇文章深入探讨了分布式PostgreSQL架构的不同类型及其各自的权衡。

    文章讨论了几种知名的架构,包括网络附加块存储(如EBS)、只读副本、DBMS优化的云存储(如Aurora)、活动-活动(如BDR)、透明分片(如Citus)和分布式键值存储与SQL(如Yugabyte)。并详细描述了每种架构的优缺点,并提供了使用这些架构时的指导原则。
  2. 全球 150+ UX 设计系统收集 | sheets

    国内设计师 Tuohai 做设计系统调研收集了 150 多个设计系统,列清楚了支持的平台和官网地址、Figma 文件地址。
  3. CRUXEval是一个用于评估Python代码推理、理解和执行的基准,包含两个任务:CRUXEval-I和CRUXEval-O,用于评估输入和输出预测。

    该基准测试包括800个Python函数和输入输出对,最佳模型GPT-4在CRUXEval-I和CRUXEval-O上的pass @ 1 分别达到67%和63%。尽管Code Llama 34B等模型在大量代码数据上进行了训练,但仅达到了47%和44%的准确率。

    该基准测试强调了代码推理能力的重要性,并鼓励未来的代码语言模型评估考虑CRUXEval。
  4. Smart Excel:一个足够简单(调用CloseAI的API)却又功能俱全(有登录和支付)的demo级产品。

    [技术栈]
    前后端:Next.js+Tailwind+Prisma
    登录:Next-Auth
    支付:Lemon Squeezy
    部署:Vercel

    你可以基于这个项目快速开发自己的SaaS产品。 ​​​

    工作原理:该项目使用ChatGPT API和具有流功能的Vercel Al SDK。它基于表单和用户输入构建提示,将其发送至ChatGPTAPI通过Vercel边缘函数,然后将响应流式传输回应用程序界面。
  5. Alter3:一个能够执行 ChatGPT 指令的仿人机器人

    东京大学的研究人员成功将仿人机器人 Alter3 与 GPT-4 连接。他们利用指令让这个机器人完成了一系列的人类行为,例如弹吉他、自拍、扮演鬼魂角色,甚至在电影院偷吃别人的爆米花。

    这一过程可以看作是一场现代化的“哑剧游戏”:大语言模型 (Large Language Model) 将书面指令转换为可执行的代码,从而让机器人能够模仿出多种人类的动作。
  6. 一个多样化且高质量的以数学为中心的语料库,包含约 95 亿个tokens。其数据包括教科书(包括讲义)、arXiv、维基百科、ProofWiki、StackExchange 和网页。它包含适合 K-12、大学、研究生水平和数学竞赛的数学内容。

    MathPile | #语料库