请求计算能力2.0设备(费米架构):编程
struct cudaDeviceProp device_prop; int chosen_device; memeset(device_prop, 0, sizeof(cudaDeviceProp)); device_prop.major = 2; device_prop.minor = 0; if(cudaChooseDevice(&chosen_device, device_prop) != cudaErrorInvalidValue) { CUDA_CALL(cudaSetDevice(chosen_device)); }
cuda错误处理:架构
每一个函数返回一个错误代码时,每次函数调用必须进行错误检查,并编写处理函数。这使得错误处理很麻烦,而且致使高度缩进的程序代码:函数
if (cudaMalloc(..) == cudaSuccess) { if (cudaEventCreate(&event) == cudaSuccess) { } } else { ... }
为了重复性的编程,可使用下面的宏来调用CUDA应用程序接口:code
#define CUDA_CALL(x) {const cudaError_t a=(x); if (a != cudaSuccess) {printf("\nCUDAError:%s(err_num=%d)\n",cudaGetErrorString(a),a); cudaDeviceReset(); assert(0);}}