熟悉 C++, GPU kernels, CUDA, Triton, CUTLASS
一文了解GPU并行计算CUDA
Triton tutorial
https://github.com/cuda-mode/lectures
CUDA-MODE 课程笔记 第一课: 如何在 PyTorch 中 profile CUDA kernels - BBuf的文章 - 知乎
https://github.com/xlite-dev/LeetCUDA
Last updated 1 month ago