开始学CUDA 先写一个简单的
#include<iostream>
__global__ void add( int a, int b, int *c ) { *c = a + b;}int main(){ int c; int * dev_c; cudaMalloc((void**)&dev_c,sizeof(int));//在显存开辟空间 add<<<1,1>>>(10,11,dev_c);//为函数分配一个block,每个block分配一个线程 cudaMemcpy(&c,dev_c,sizeof(int),cudaMemcpyDeviceToHost);//讲显存数据拷贝到内存交给cpu处理 printf("%d",c); return 0;}