A case for learning GPU programming with a compute-first mindset初学者进入GPU编程领域，常被“Hello Triangle”这类复杂且冗长的图形渲染示例绊倒，耗费数周调试才能显示简单图形，令人望而却步

A case for learning GPU programming with a compute-first mindset

初学者进入GPU编程领域，常被“Hello Triangle”这类复杂且冗长的图形渲染示例绊倒，耗费数周调试才能显示简单图形，令人望而却步。2025年，单纯从传统图形渲染入门已不合时宜。本文作者主张从“计算优先”角度切入GPU编程，先掌握compute shader（计算着色器）和调试工具RenderDoc，深入理解GPU如何执行代码，再逐步引入光栅化流水线，避免一开始面对庞大复杂的图形API。

相比CUDA、OpenCL，作者推荐使用Vulkan的计算功能作为入门，因其兼顾计算与图形，且配合中间抽象层（如作者自用的Granite）降低入门门槛。通过RenderDoc捕获与调试，结合SPIR-V与GLSL反编译、shader替换调试，能够高效定位并解决复杂并行计算中的问题。文章详细阐述了GPU计算的执行模型——工作组与子组的层次结构，以及不同厂商硬件的子组大小差异，帮助读者建立正确的性能思维。

文中还介绍了如何使用缓冲区设备地址、描述符（descriptors）管理资源，说明了Vulkan绑定模型的基本工作原理及其在Granite中的实现细节，同时演示了如何借助VK_EXT_descriptor_buffer扩展简化描述符管理。作者通过实例展示了将ShaderToy的图形着色器移植为计算着色器，拓展了计算着色器的应用边界。

接下来，作者建议逐步深入学习原子操作、无锁编程、共享内存、子组操作、纹理采样、图像处理、内存一致性与多工作组通信等关键技术，掌握API同步与CPU-GPU流水线优化，最终再回到光栅化图形渲染，完成从计算到图形的全面能力构建。

这篇文章为GPU编程的新手提供了一条极具实践意义的学习路径：抛弃传统图形渲染的繁琐，从计算着色器与强大调试工具入手，循序渐进掌握GPU的真正能力。对GPU编程爱好者和开发者而言，值得反复研读并实践。