CUDA编程:存储器模型

1. 每个线程拥有自己的register和local memory。 Register是GPU片上的高速缓存器,执行单元可以以极低的延迟访问寄存器。Local memory也是私有的,如果register被消耗完,数据将被存储在local memory中。如果每个线程使用了过多的register,或声明了大型结构体或数组,或者编译器无法确定数组的大小,线程的私有数据就有可能会被分配到local m
相关文章
相关标签/搜索