13:28 · Mar 4, 2024 · Mon × × 分布式Llama:该项目证明可以将 LLMs 的工作负载分散到多个设备上并实现显着的加速。比如可以在8 个树莓派 4B 运行 Llama 2-70B
13:04 · Mar 4, 2024 · Mon × × × × × × × × × 一位鹅厂的开发者zishun分享关于做技术开发如何做出成绩的一些理解。(by鹅厂程序员)他在技术领域工作近 20 余年,从独立开发者做到了技术专家,也管过上百人团队,他从价值对齐,技术层次,行动建议等三个方面,提供了一些实用、中肯的经验总结。| #经验
12:51 · Mar 4, 2024 · Mon × 写自己的JVM系列文章 | write-your-own-jvmJava虚拟机非常复杂,要想真正理解它的工作原理,最好的方式就是自己动手写一个。但是这个系列的定位还是入门,所以有很多的东西暂时都不会实现,比如 malloc,GC,多线程,native interface等。主要的目的还是在于大致了解JVM是一个什么样的东西,这也是作者采用java来实现JVM的一个原因,便于理解。
14:54 · Mar 2, 2024 · Sat × The Foundation Model Development Cheatsheet:基础模型开发速查,旨在提供开发和发布模型的最佳实践。重点关注工具,如数据目录、搜索/分析工具、评估存储库,以及总结、调查或指导重要开发决策的文献github | home
14:52 · Mar 2, 2024 · Sat × × × 代表性LLM文本数据集大列表,包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集Awesome-LLMs-Datasets | #数据集