环境:win7_64 VS2010 CUDA6.0 VAX Quadro410函数
安装配置CUDA环境,这里就不详细介绍了。spa
1、手动创建CUDA工程code
打开VS2010,新建空白项目,起名为 test2。 接口
在解决方案管理器中,右键点击工程test2,生成自定义,选择CUDA6.0文档
添加头文件 t.h,注意这里t.cuh,也是能够的,可是为了外观上等同于纯C\C++类库,写成.h编译器
添加源文件 t.cu ,右键点击t.cu,属性,常规,项类型,选择CUDA C/C++。it
这样一个手动创建的CUDA工程就配置好了。io
2、创建CUDA类库,并生成dll编译
在t.h中,写上函数声明,包含两类函数,一是KERNEL函数,使用GPU的并行计算;二是调用KERNEL函数的普通C函数。这两类函数必须放到cu文件中,由CUDA编译器编译,内容以下:class
#ifndef _TEST2_H #define _TEST2_H//防护重复编译 #ifdef _DLLEXPORTING//dll处处符号宏定义 #define TEST2_DLLDECL __declspec(dllexport) #else #define TEST2_DLLDECL __declspec(dllimport) #endif #include "cuda_runtime.h" #include "device_launch_parameters.h" //这两个头文件是CUDA必备,可是你右键->打开文档“”的时候VS却不能找到。不须要你手动设置路径,只须要在 右键工程->生成自定义 中,选择CUDA,VS便可自动找到包含路径 #include <stdio.h> __global__ void addKernel(int *c, const int *a, const int *b);//这个是KERNEL函数,不能做为类库外部接口 cudaError_t TEST2_DLLDECL addWithCuda(int *c, const int *a, const int *b, unsigned int size);//这个C函数,内部调用了KERNEL函数,只能放在cu文件中,使用CUDA编译器编译。使用__declspec(dllimport)调用声明,做为dll的接口供外部调用。
2.在t.cu中写入两个函数的实现,以下:
#include "t.h" __global__ void addKernel(int *c, const int *a, const int *b) { int i = threadIdx.x; c[i] = a[i] + b[i]; } cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size) { //其余代码省略 addKernel<<<1, size>>>(dev_c, dev_a, dev_b); //其余代码省略 return cudaStatus; }
3.工程属性,CUDA C\C++中,选择Host ,Proprocessor Definition 中,添加_DLLEXPORTING
4.在工程属性中,设置生成目标为DLL,这样会生成,dll,lib,pdb,等几种文件
3、普通C++工程调用CUDA类库dll
在相同解决方案中新建工程,在工程属性中,连接器,常规,附加库目录,添加上一步生成的lib所在的目录;在连接器,输入,附加依赖项,添加test2.lib;保证你生成的exe和dll在同一目录下。
工程,右键,生成自定义,选择CUDA
虽然CUDA编译器参与了生成过程,可是这个工程就是普通的C、C++工程, 自身使用VC编译器,你只须要添加#include“..\\test2\\test2.h”就好了