CUDA学习(十)

内存映射: 在将原来的在CPU上运行的程序改为到GPU上进行并行的程序时,主机与设备之间数据传输的时间的问题将被暴露出来,通常程序处理只需几十毫秒甚至更少,但数据传输的时间将远远大于传输的时间,内存映射的方法能很好解决,不必传输数据。 通过将标志cudaHostAllocMapped传递给cudaHostAlloc()或将标志cudaHostRegisterMapped传递给cudaHostReg
相关文章
相关标签/搜索