CUDA全局内存-对齐与合并

CUDA执行模型的特征之一指令都是以线程束为单位进行发布和执行,存储操作也是如此。 通常情况下,如图所示,全局内存是通过缓存进行加载,而加载请求是通过所谓“内存事务”来实现的,“内存事务”分为32字节和128字节两种。要么一次性加载32字节,要么一次性加载128字节,这主要取决于设备的缓存路径。 如果对全局内存的访问使用L1/L2缓存存储(路径1),那么访问必须由128字节的“内存事务”完成,因此
相关文章
相关标签/搜索