13:04 · Mar 4, 2024 · Mon × × × × × × × × × 一位鹅厂的开发者zishun分享关于做技术开发如何做出成绩的一些理解。(by鹅厂程序员)他在技术领域工作近 20 余年,从独立开发者做到了技术专家,也管过上百人团队,他从价值对齐,技术层次,行动建议等三个方面,提供了一些实用、中肯的经验总结。| #经验
12:51 · Mar 4, 2024 · Mon × 写自己的JVM系列文章 | write-your-own-jvmJava虚拟机非常复杂,要想真正理解它的工作原理,最好的方式就是自己动手写一个。但是这个系列的定位还是入门,所以有很多的东西暂时都不会实现,比如 malloc,GC,多线程,native interface等。主要的目的还是在于大致了解JVM是一个什么样的东西,这也是作者采用java来实现JVM的一个原因,便于理解。
14:54 · Mar 2, 2024 · Sat × The Foundation Model Development Cheatsheet:基础模型开发速查,旨在提供开发和发布模型的最佳实践。重点关注工具,如数据目录、搜索/分析工具、评估存储库,以及总结、调查或指导重要开发决策的文献github | home
14:52 · Mar 2, 2024 · Sat × × × 代表性LLM文本数据集大列表,包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集Awesome-LLMs-Datasets | #数据集
14:42 · Mar 2, 2024 · Sat × luminal:一个深度学习库,利用可组合的编译器实现高性能。它以极快的速度运行,支持Metal和CUDA,使用Rust编写,直接与底层API交互,无需中间层。其核心思想是提前编译所有内容,采用静态计算图实现惰性执行,使得编译器可以全局优化,实现了高效的核心运算与编译时间的分离。
14:42 · Mar 2, 2024 · Sat × 北京大学Yuangroup团队发起了一个 Open-Sora计划,旨在复现OpenAI 的Sora模型。Open Sora Plan通过视频VQ-VAE、Denoising Diffusion Transformer和条件编码器等技术组件,来实现Sora模型的功能。它由以下组成部分组成。1. Video VQ-VAE.2. Denoising Diffusion Transformer.3. Condition Encoder.