CUDA编程

1.2 CUDA编程模型之启动CUDA内核

2020-07-07  本文已影响0人  Catherin_gao

1. 启动CUDA内核

1.1启动CUDA内核函数格式

kernel_name <<<grid, block>>>(argument list);
kernel_name<<<4, 8>>>(argument list);
thread编号.png

1.2 CUDA内核启动

cudaError_t cudaDeviceSynchronize(void);
cudaError_t cudaMemcpy(void* dst, const void* src, size_t count, cudaMemcpyKind kind);

2. 写自己的GPU kernel

关键词 global会告诉编译器这个函数在CPU上调用,在GPU上执行。

__global__ void helloFromGPU(void) {
    printf(“Hello World from GPU!\n”); 
}

3. 示例

void sumArraysOnHost(float *A, float *B, float *C, const int N) { 
    for (int i = 0; i < N; i++)
        C[i] = A[i] + B[i];
}

GPU代码:

     __global__ void sumArraysOnGPU(float *A, float *B, float *C) {
          int i = threadIdx.x;
          C[i] = A[i] + B[i];
}

内置的thread坐标变量用来替换array坐标i,使用启动GPU kernel来启动N个threads。

sumArraysOnGPU<<<1,32>>>(float *A, float *B, float *C);

4. 验证Kernel正确性

上一篇下一篇

猜你喜欢

热点阅读