CUDA学习(三十二)

本地内存: 本地内存访问只对一些自动变量发生,如可变内存空间说明符中所述。 编译器可能在本地内存中放置的自动变量是: 不能确定它们是以固定数量进行索引的数组, 大型结构或阵列会消耗太多的寄存器空间, 任何变量,如果内核使用更多的寄存器比可用(这也被称为寄存器溢出)。 检查PTX汇编代码(通过使用-ptx orkeep选项编译获得)将会告诉在第一个编译阶段变量是否被放置在本地内存中,因为它将使用.l
相关文章
相关标签/搜索