黑洞资源笔记

02:09 · Nov 4, 2025 · Tue

A case for learning GPU programming with a compute-first mindset

初学者进入GPU编程领域，常被“Hello Triangle”这类复杂且冗长的图形渲染示例绊倒，耗费数周调试才能显示简单图形，令人望而却步。2025年，单纯从传统图形渲染入门已不合时宜。本文作者主张从“计算优先”角度切入GPU编程，先掌握compute shader（计算着色器）和调试工具RenderDoc，深入理解GPU如何执行代码，再逐步引入光栅化流水线，避免一开始面对庞大复杂的图形API。

相比CUDA、OpenCL，作者推荐使用Vulkan的计算功能作为入门，因其兼顾计算与图形，且配合中间抽象层（如作者自用的Granite）降低入门门槛。通过RenderDoc捕获与调试，结合SPIR-V与GLSL反编译、shader替换调试，能够高效定位并解决复杂并行计算中的问题。文章详细阐述了GPU计算的执行模型——工作组与子组的层次结构，以及不同厂商硬件的子组大小差异，帮助读者建立正确的性能思维。

文中还介绍了如何使用缓冲区设备地址、描述符（descriptors）管理资源，说明了Vulkan绑定模型的基本工作原理及其在Granite中的实现细节，同时演示了如何借助VK_EXT_descriptor_buffer扩展简化描述符管理。作者通过实例展示了将ShaderToy的图形着色器移植为计算着色器，拓展了计算着色器的应用边界。

接下来，作者建议逐步深入学习原子操作、无锁编程、共享内存、子组操作、纹理采样、图像处理、内存一致性与多工作组通信等关键技术，掌握API同步与CPU-GPU流水线优化，最终再回到光栅化图形渲染，完成从计算到图形的全面能力构建。

这篇文章为GPU编程的新手提供了一条极具实践意义的学习路径：抛弃传统图形渲染的繁琐，从计算着色器与强大调试工具入手，循序渐进掌握GPU的真正能力。对GPU编程爱好者和开发者而言，值得反复研读并实践。

02:06 · Nov 4, 2025 · Tue

上千小时调教AI提示，凝练出6大黄金法则——KERNEL框架

作为一名技术负责人，我过去一年沉迷于Prompt工程，分析了1000+真实工作场景的提示，发现成功提示背后有6个核心模式。我称之为KERNEL。它彻底改变了我们团队利用AI的方式。

KERNEL框架详解：

K - Keep it simple（保持简洁）
避免冗长背景，明确单一目标。
例：“写Redis教程”，胜过“帮我写点关于Redis的东西”。
效果：减少70%令牌使用，响应速度提升3倍。

E - Easy to verify（易于验证）
提示中必须有清晰的成功标准。
“包含3个代码示例”比“让内容吸引人”更具体可检验。
测试显示：有明确标准的提示成功率达85%，无标准仅41%。

R - Reproducible results（结果可复现）
避免使用时间敏感词汇，如“最新趋势”。
指定具体版本和明确需求，保证同一提示未来仍有效。
测试中30天内一致性高达94%。

N - Narrow scope（聚焦单一目标）
一个提示只解决一个问题。
不要把代码、文档、测试混合请求，拆分复杂任务。
单目标满意度89%，多目标仅41%。

E - Explicit constraints（明确限制）
告诉AI不要做什么。
如“Python代码，不用外部库，函数不超过20行”。
限制减少91%无关输出。

L - Logical structure（逻辑清晰）
提示结构固定：
1. 上下文（Context）
2. 任务（Task）
3. 限制（Constraints）
4. 格式（Format）

实战对比：
旧提示：“帮我写个脚本处理数据，提高效率”→200行无用代码
KERNEL提示：
Task: Python脚本合并多CSV，列一致
Constraints: 只用Pandas，<50行
Output: 生成merged.csv
Verify: 在test_data/测试
结果：37行代码，一次成功

指标提升（1000条提示对比）：
首次成功率从72%升至94%
产出时间减少67%
令牌消耗降低58%
准确率提高340%
修改次数由3.2降至0.4

进阶技巧：拆分复杂需求，链式调用多个KERNEL提示，每条专注一事，效果更佳。

最棒的是，KERNEL适用于GPT-5、Claude、Gemini及Llama等多种模型，完全无关模型类型。

02:02 · Nov 4, 2025 · Tue

学习应用型AI时，掌握系统化的知识路径和实战技巧尤为重要。AI Engineering Academy 致力于将复杂的 AI 概念拆解成清晰的学习路线，帮助每个人循序渐进地掌握实用技能。

平台涵盖提示工程、知识增强生成（RAG）、模型微调、AI代理等主题，配套真实项目实践，内容紧贴行业需求，适合想从基础到高级深入学习 AI 的开发者和研究者。

不仅有结构化课程和动手项目，还有活跃的社区支持，方便交流与协作。所有资源开源托管在 GitHub

主要特点：

- 系统化学习路径，覆盖从基础到前沿的 AI 技术
- 注重实战操作，提供真实项目案例和代码示范
- 课程内容紧密结合工业应用，助力职业发展
- 多主题覆盖提示工程、RAG、微调、AI代理等关键领域
- 开源社区驱动，欢迎参与贡献和课程改进
- 适合自学者、学生、工程师及 AI 爱好者

15:27 · Nov 3, 2025 · Mon