Skip to main content

黑洞资源笔记

  1. CRUXEval是一个用于评估Python代码推理、理解和执行的基准,包含两个任务:CRUXEval-I和CRUXEval-O,用于评估输入和输出预测。

    该基准测试包括800个Python函数和输入输出对,最佳模型GPT-4在CRUXEval-I和CRUXEval-O上的pass @ 1 分别达到67%和63%。尽管Code Llama 34B等模型在大量代码数据上进行了训练,但仅达到了47%和44%的准确率。

    该基准测试强调了代码推理能力的重要性,并鼓励未来的代码语言模型评估考虑CRUXEval。
  2. Smart Excel:一个足够简单(调用CloseAI的API)却又功能俱全(有登录和支付)的demo级产品。

    [技术栈]
    前后端:Next.js+Tailwind+Prisma
    登录:Next-Auth
    支付:Lemon Squeezy
    部署:Vercel

    你可以基于这个项目快速开发自己的SaaS产品。 ​​​

    工作原理:该项目使用ChatGPT API和具有流功能的Vercel Al SDK。它基于表单和用户输入构建提示,将其发送至ChatGPTAPI通过Vercel边缘函数,然后将响应流式传输回应用程序界面。
  3. Alter3:一个能够执行 ChatGPT 指令的仿人机器人

    东京大学的研究人员成功将仿人机器人 Alter3 与 GPT-4 连接。他们利用指令让这个机器人完成了一系列的人类行为,例如弹吉他、自拍、扮演鬼魂角色,甚至在电影院偷吃别人的爆米花。

    这一过程可以看作是一场现代化的“哑剧游戏”:大语言模型 (Large Language Model) 将书面指令转换为可执行的代码,从而让机器人能够模仿出多种人类的动作。
  4. 一个多样化且高质量的以数学为中心的语料库,包含约 95 亿个tokens。其数据包括教科书(包括讲义)、arXiv、维基百科、ProofWiki、StackExchange 和网页。它包含适合 K-12、大学、研究生水平和数学竞赛的数学内容。

    MathPile | #语料库
  5. Motūrus OS是一个基于微内核的操作系统,使用Rust构建,专门针对虚拟化工作负载。它目前支持x64基于KVM的虚拟机,并且可以在Qemu或云虚拟机监视器中运行。
  6. 前不久,麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM能够在不牺牲推理速度和生成效果的前提下实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。

    但 StreamingLLM 使用原生 PyTorch 实现,对于多轮对话推理场景落地应用的低成本、低延迟、高吞吐等需求仍有优化空间。

    因此,知名 AI 框架 Colossal-AI 开源了 SwiftInfer,基于 TensorRT 实现了 StreamingLLM,可以 进一步提升大模型推理性能 46%,为多轮对话推理提供了高效可靠的落地方案。
  7. GPT-Analyst:专门用于GPT分析和逆向工程的项目,提供了一系列资源,包括保护GPT提示和防止指令泄露和盗版的综合指南,以及GPT-Analyst工具,用于详细分析系统提示和GPT指令,可以使用不同的命令进行安全分析、操作分析、越狱分析等
  8. 我们读什么计算机书 | blog

    作为一个软件工程师,提升自己能力的最重要的手段之一是读书。资深的工程师需要防止自己能力的腐化,防止自己代码的腐化,通过不断读书来补齐知识的短板。新加入职场的工程师,前面几年更应该是大量密集读书的时期,多花一些业余的时间,从一开始就树立对软件开发的正确认知,价值回报会伴随整个职业生涯。

    通过陈列一个书单,能帮你大致梳理软件开发的知识脉络,有针对性地去加强和巩固自己的知识,对于经验丰富的工程师,也可以继续学习。

    本文将从两个维度来评价每本书籍:
    推荐度:代表作者对书的价值的主观评价,1~5分,越高代表越有价值。

    优先级:代表读这本书的紧急程度(尤其针对新人),1~5分,越小代表越早读。
  9. Large Language Models Course:关于大型语言模型的实用课程,课程以实践为导向,通过使用OpenAI和Hugging Face库的模型进行实际操作来提供实践经验。

    课程分为三个主要部分:技术与库、项目和企业解决方案。提供了丰富的笔记本和文章,供学习者参考。
  10. Docker Crash Course:关于Docker的完整教程,包含了使用不同技术栈构建的各种应用的Docker化实例,涵盖了Docker的基础知识、镜像和容器的管理、最新的Docker特性等内容。

    通过这个项目,可以学习到如何将应用容器化,并掌握Docker在不同场景下的使用方法和最佳实践。
  11. plb2:编程语言基准测试,评估了25种编程语言在四个CPU密集型任务上的性能,其目标是衡量在使用该语言实现新算法时的性能。任务包括nqueen、matmul、sudoku和bedcov,项目提供了各种语言的实现,并提供了性能比较数据和讨论
  12. 本项目旨在指导程序员们如何从基础开始系统的学习 Go 语言,并学习开发时所需知识点。

    Go 是一门非常容易上手的语言,语法简洁,代码易读,如果你有常用语言的基础,那看一本Go 语言圣经后便可上手开发业务代码。

    本项目不是博客,一个问题不会讲的特别细致,如果想要更加深入的了解某个知识点的话,建议使用搜索引擎去搜索经典博客加深理解,项目中也会推荐一些好的文章供参考。

    本项目更加看重的是对于知识点系统的一个总结,能够通过一句话,一张思维导图来把一类知识进行讲解,这样在面试前把所有的思维导图都过一遍就快的吸收知识点,平时空余的时候拿出思维导图进行复习也能加深理解。

    GolangStudy | #Go语言