CUDA 共享内存

GPU设备中的共享内存比全局内存访问效率高,一种借助共享内存的通用办法是,数据分块之后,将一个线程块中需要从全局内存中读取的数据全部读到共享内存中,然后线程块中的所有线程在执行时,只需要读取共享内存即可。 共享内存中所谓的共享是对线程块而言,也就是说同一个线程块中的所有线程共享这块内存。为了使得一个wrap中的线程可以在同一个时刻并行访问共享内存,共享存储器被组织成了32个bank,每个bank有
相关文章
相关标签/搜索