6. cuda warp

6. cuda warp 在cuda中,线程块在单流多处理器上运行。 当设备内存足够时,多个block可以在同一个sm上运行。 SIMT(Single instruction multiple threads): 一个指令多个线程执行(cuda的本质) 一个线程块不能再多个SM中执行。当一个SM中不能跑一个block的时候,(共享内存溢出时), 内核发射失败,函数将返回 cudaSucess以外的
相关文章
相关标签/搜索