如何封装CUDA类库,编译成dll以供其余工程调用

环境:win7_64 VS2010 CUDA6.0 VAX Quadro410函数

安装配置CUDA环境,这里就不详细介绍了。spa

1、手动创建CUDA工程code

  1. 打开VS2010,新建空白项目,起名为 test2。 接口

  2. 在解决方案管理器中,右键点击工程test2,生成自定义,选择CUDA6.0文档

  3. 添加头文件 t.h,注意这里t.cuh,也是能够的,可是为了外观上等同于纯C\C++类库,写成.h编译器

  4. 添加源文件 t.cu ,右键点击t.cu,属性,常规,项类型,选择CUDA C/C++。it

    这样一个手动创建的CUDA工程就配置好了。io

2、创建CUDA类库,并生成dll编译

  1. 在t.h中,写上函数声明,包含两类函数,一是KERNEL函数,使用GPU的并行计算;二是调用KERNEL函数的普通C函数。这两类函数必须放到cu文件中,由CUDA编译器编译,内容以下:class

#ifndef _TEST2_H
#define _TEST2_H//防护重复编译
#ifdef _DLLEXPORTING//dll处处符号宏定义
#define TEST2_DLLDECL __declspec(dllexport)
#else
#define TEST2_DLLDECL __declspec(dllimport)
#endif
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
//这两个头文件是CUDA必备,可是你右键->打开文档“”的时候VS却不能找到。不须要你手动设置路径,只须要在 右键工程->生成自定义 中,选择CUDA,VS便可自动找到包含路径
#include <stdio.h>
__global__ void addKernel(int *c, const int *a, const int *b);//这个是KERNEL函数,不能做为类库外部接口
cudaError_t TEST2_DLLDECL  addWithCuda(int *c, const int *a, const int *b, unsigned int size);//这个C函数,内部调用了KERNEL函数,只能放在cu文件中,使用CUDA编译器编译。使用__declspec(dllimport)调用声明,做为dll的接口供外部调用。

    2.在t.cu中写入两个函数的实现,以下:

#include "t.h"
__global__ void addKernel(int *c, const int *a, const int *b)
{
    int i = threadIdx.x;
    c[i] = a[i] + b[i];
}
cudaError_t addWithCuda(int *c, const int *a, const int *b, unsigned int size)
{
 //其余代码省略
        addKernel<<<1, size>>>(dev_c, dev_a, dev_b);
        //其余代码省略
 return cudaStatus;
}

    3.工程属性,CUDA C\C++中,选择Host ,Proprocessor Definition 中,添加_DLLEXPORTING

    4.在工程属性中,设置生成目标为DLL,这样会生成,dll,lib,pdb,等几种文件

3、普通C++工程调用CUDA类库dll

  1. 在相同解决方案中新建工程,在工程属性中,连接器,常规,附加库目录,添加上一步生成的lib所在的目录;在连接器,输入,附加依赖项,添加test2.lib;保证你生成的exe和dll在同一目录下。

  2. 工程,右键,生成自定义,选择CUDA

  3. 虽然CUDA编译器参与了生成过程,可是这个工程就是普通的C、C++工程, 自身使用VC编译器,你只须要添加#include“..\\test2\\test2.h”就好了

相关文章
相关标签/搜索