01:47 · Jan 9, 2024 · Tue × CRUXEval是一个用于评估Python代码推理、理解和执行的基准,包含两个任务:CRUXEval-I和CRUXEval-O,用于评估输入和输出预测。该基准测试包括800个Python函数和输入输出对,最佳模型GPT-4在CRUXEval-I和CRUXEval-O上的pass @ 1 分别达到67%和63%。尽管Code Llama 34B等模型在大量代码数据上进行了训练,但仅达到了47%和44%的准确率。该基准测试强调了代码推理能力的重要性,并鼓励未来的代码语言模型评估考虑CRUXEval。
01:40 · Jan 9, 2024 · Tue × Smart Excel:一个足够简单(调用CloseAI的API)却又功能俱全(有登录和支付)的demo级产品。[技术栈]前后端:Next.js+Tailwind+Prisma登录:Next-Auth支付:Lemon Squeezy部署:Vercel你可以基于这个项目快速开发自己的SaaS产品。 工作原理:该项目使用ChatGPT API和具有流功能的Vercel Al SDK。它基于表单和用户输入构建提示,将其发送至ChatGPTAPI通过Vercel边缘函数,然后将响应流式传输回应用程序界面。
12:00 · Jan 8, 2024 · Mon Alter3:一个能够执行 ChatGPT 指令的仿人机器人东京大学的研究人员成功将仿人机器人 Alter3 与 GPT-4 连接。他们利用指令让这个机器人完成了一系列的人类行为,例如弹吉他、自拍、扮演鬼魂角色,甚至在电影院偷吃别人的爆米花。这一过程可以看作是一场现代化的“哑剧游戏”:大语言模型 (Large Language Model) 将书面指令转换为可执行的代码,从而让机器人能够模仿出多种人类的动作。
11:17 · Jan 8, 2024 · Mon × 一个多样化且高质量的以数学为中心的语料库,包含约 95 亿个tokens。其数据包括教科书(包括讲义)、arXiv、维基百科、ProofWiki、StackExchange 和网页。它包含适合 K-12、大学、研究生水平和数学竞赛的数学内容。MathPile | #语料库
10:51 · Jan 8, 2024 · Mon × Motūrus OS是一个基于微内核的操作系统,使用Rust构建,专门针对虚拟化工作负载。它目前支持x64基于KVM的虚拟机,并且可以在Qemu或云虚拟机监视器中运行。
09:16 · Jan 8, 2024 · Mon × × 前不久,麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM能够在不牺牲推理速度和生成效果的前提下实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。但 StreamingLLM 使用原生 PyTorch 实现,对于多轮对话推理场景落地应用的低成本、低延迟、高吞吐等需求仍有优化空间。因此,知名 AI 框架 Colossal-AI 开源了 SwiftInfer,基于 TensorRT 实现了 StreamingLLM,可以 进一步提升大模型推理性能 46%,为多轮对话推理提供了高效可靠的落地方案。
09:12 · Jan 8, 2024 · Mon × GPT-Analyst:专门用于GPT分析和逆向工程的项目,提供了一系列资源,包括保护GPT提示和防止指令泄露和盗版的综合指南,以及GPT-Analyst工具,用于详细分析系统提示和GPT指令,可以使用不同的命令进行安全分析、操作分析、越狱分析等
09:10 · Jan 8, 2024 · Mon × 我们读什么计算机书 | blog作为一个软件工程师,提升自己能力的最重要的手段之一是读书。资深的工程师需要防止自己能力的腐化,防止自己代码的腐化,通过不断读书来补齐知识的短板。新加入职场的工程师,前面几年更应该是大量密集读书的时期,多花一些业余的时间,从一开始就树立对软件开发的正确认知,价值回报会伴随整个职业生涯。通过陈列一个书单,能帮你大致梳理软件开发的知识脉络,有针对性地去加强和巩固自己的知识,对于经验丰富的工程师,也可以继续学习。本文将从两个维度来评价每本书籍:推荐度:代表作者对书的价值的主观评价,1~5分,越高代表越有价值。优先级:代表读这本书的紧急程度(尤其针对新人),1~5分,越小代表越早读。
11:27 · Jan 7, 2024 · Sun × autotranslate 用Faster Whisper和ChatGPT实现视频的转录和翻译,支持多平台和本地视频文件,可用于支持的网站(如YouTube、Twitter、Bilibili等)
10:47 · Jan 7, 2024 · Sun × Large Language Models Course:关于大型语言模型的实用课程,课程以实践为导向,通过使用OpenAI和Hugging Face库的模型进行实际操作来提供实践经验。课程分为三个主要部分:技术与库、项目和企业解决方案。提供了丰富的笔记本和文章,供学习者参考。
10:18 · Jan 7, 2024 · Sun × Docker Crash Course:关于Docker的完整教程,包含了使用不同技术栈构建的各种应用的Docker化实例,涵盖了Docker的基础知识、镜像和容器的管理、最新的Docker特性等内容。通过这个项目,可以学习到如何将应用容器化,并掌握Docker在不同场景下的使用方法和最佳实践。
10:17 · Jan 7, 2024 · Sun × plb2:编程语言基准测试,评估了25种编程语言在四个CPU密集型任务上的性能,其目标是衡量在使用该语言实现新算法时的性能。任务包括nqueen、matmul、sudoku和bedcov,项目提供了各种语言的实现,并提供了性能比较数据和讨论
10:12 · Jan 7, 2024 · Sun Foxtrot:全能的Bevy 3D游戏模板,提供了各种功能和工具,包括角色控制、物理引擎、音频、寻路、对话系统等,可用于快速开发3D游戏 | #模板 0:37 Media is too big VIEW IN TELEGRAM
16:31 · Jan 6, 2024 · Sat × × × × × × × 本项目旨在指导程序员们如何从基础开始系统的学习 Go 语言,并学习开发时所需知识点。Go 是一门非常容易上手的语言,语法简洁,代码易读,如果你有常用语言的基础,那看一本Go 语言圣经后便可上手开发业务代码。本项目不是博客,一个问题不会讲的特别细致,如果想要更加深入的了解某个知识点的话,建议使用搜索引擎去搜索经典博客加深理解,项目中也会推荐一些好的文章供参考。本项目更加看重的是对于知识点系统的一个总结,能够通过一句话,一张思维导图来把一类知识进行讲解,这样在面试前把所有的思维导图都过一遍就快的吸收知识点,平时空余的时候拿出思维导图进行复习也能加深理解。GolangStudy | #Go语言