CUDA计算直方图(二) 共享内存 __shared__

参考: Shane Cook. CUDA Programming: A developer’s guide to parallel computing with GPUs 共享内存 共享内存是一块特殊的内存, 因为它存在于芯片上并且存取速度比全局内存快. 可以在共享内存上创建一个包含256个bin的局部统计直方图, 最后将所有共享内存上计算得到的统计直方图通过原子操作汇总到全局内存. 这样可以节省
相关文章
相关标签/搜索