欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

CUDA:关于threadIdx,blockIdx, blockDim, gridDim的维度,取值等问题

程序员文章站 2022-06-22 09:53:05
...

原文写的很好,但关于行优先的问题有一个错误我直接给更正了吧,另外简单表示了下维度的表示方法。
原文处处

在启动kernel的时候,要通过指定gridsize和blocksize才行,举下面的例子说说:

dim3 gridsize(2,2);

dim3 blocksize(4,4);

kernel<<<gridsize,blocksize>>>(para....);

gridsize相当于是一个22的block,gridDim.x,gridDim.y,gridDim.z相当于这个dim3的x,y,z方向的线程个数,这里是22*1。序号从0到3,***顺序是行优先,就是从左到右。 ***
grid中的blockidx序号标注情况为:

| 0 | 1 |
| 2 | 3 |

blocksize则是指里面的thread的情况,blockDim.x,blockDim.y,blockDim.z相当于这个dim3的x,y,z方向的维度,这里是441.序号是0-15
然后求实际的tid的时候:
CUDA:关于threadIdx,blockIdx, blockDim, gridDim的维度,取值等问题
最后还发现了一个2D * 2D 表示threadid的二维位置的标示图, 适用于将每个threadid跟矩阵中的二维元素进行一一对应。

CUDA:关于threadIdx,blockIdx, blockDim, gridDim的维度,取值等问题

相关标签: CUDA