黑洞资源笔记

13:04 · Mar 4, 2024 · Mon

一位鹅厂的开发者zishun分享关于做技术开发如何做出成绩的一些理解。（by鹅厂程序员)

他在技术领域工作近 20 余年，从独立开发者做到了技术专家，也管过上百人团队，他从价值对齐，技术层次，行动建议等三个方面，提供了一些实用、中肯的经验总结。| #经验

经验
12:51 · Mar 4, 2024 · Mon

写自己的JVM系列文章 | write-your-own-jvm

Java虚拟机非常复杂，要想真正理解它的工作原理，最好的方式就是自己动手写一个。

但是这个系列的定位还是入门，所以有很多的东西暂时都不会实现，比如 malloc，GC，多线程，native interface等。

主要的目的还是在于大致了解JVM是一个什么样的东西，这也是作者采用java来实现JVM的一个原因，便于理解。
12:48 · Mar 4, 2024 · Mon

大模型面试题及答案
14:54 · Mar 2, 2024 · Sat

The Foundation Model Development Cheatsheet：基础模型开发速查，旨在提供开发和发布模型的最佳实践。

重点关注工具，如数据目录、搜索/分析工具、评估存储库，以及总结、调查或指导重要开发决策的文献

github | home
14:52 · Mar 2, 2024 · Sat

代表性LLM文本数据集大列表，包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集

Awesome-LLMs-Datasets | #数据集

数据集
14:49 · Mar 2, 2024 · Sat

MarauderMap：大规模勒索软件样本集
14:48 · Mar 2, 2024 · Sat

ActionWeaver：AI应用框架，使LLM函数调用更加简便 | #框架

框架
14:46 · Mar 2, 2024 · Sat

图机器学习课程资料
14:42 · Mar 2, 2024 · Sat

luminal：一个深度学习库，利用可组合的编译器实现高性能。它以极快的速度运行，支持Metal和CUDA，使用Rust编写，直接与底层API交互，无需中间层。

其核心思想是提前编译所有内容，采用静态计算图实现惰性执行，使得编译器可以全局优化，实现了高效的核心运算与编译时间的分离。
14:42 · Mar 2, 2024 · Sat

北京大学Yuangroup团队发起了一个 Open-Sora计划，旨在复现OpenAI 的Sora模型。

Open Sora Plan通过视频VQ-VAE、Denoising Diffusion Transformer和条件编码器等技术组件，来实现Sora模型的功能。

它由以下组成部分组成。

1. Video VQ-VAE.
2. Denoising Diffusion Transformer.
3. Condition Encoder.