CUDA之二维数组分配内存及初始化

       在GPU中,对一维数组分配内存使用的是cudaMalloc函数,可是对于二维数组,使用cudaMalloc来分配内存并不能获得最好的性能。由于对于2D内存,对齐是一个很重要的性质,cudaMallocPitch函数可以保证分配的内存是合理对齐的,知足物理上的内存访问,所以能够保证对行访问时具备最优的效率。对数组进行初始化应当使用cudaMemset2D,进行内存赋值应当使用cudaM
相关文章
相关标签/搜索