CUDA学习(八十四)

全局内存: 计算能力3.x的设备的全局内存访问缓存在L2中,计算能力3.5或3.7的设备的全局内存访问也可缓存在上一节中描述的只读数据缓存中; 他们通常不会被L1缓存。 计算能力3.5的某些设备和计算能力3.7的设备允许通过-Xptxas -dlcm = ca选项将参与缓存L1中的全局内存访问缓存到nvcc。 高速缓存行是128字节,映射到设备内存中128字节对齐的段。 在L1和L2中缓存的内存访
相关文章
相关标签/搜索