cuda程序以及硬件的映射

  一个网格中,多个块,每个块的大小和维度是一样的,每个线程--->cuda core或者 sp(stream processor)  block-->SM。 SM 可以调度多个线程块,一个kernel 的各个线程块被分配多个SM, grid 是逻辑层 ,SM 是执行的物理层。每个SM 有自己的共享内存、寄存器 ,L1 cache 以及其他功能的硬件。一个程序的块不能被映射到不同的SM上,一个bl
相关文章
相关标签/搜索