GPU 并行结构层次

从程序上,GPU的并行层次依次为 grid  block  wrap 每个kernel对应一个grid。wrap内的线程可以通过调度器来控制运行,一个wrap内的线程同时执行。wrap 的大小为32,所有指定block 的大小时,最好是32的大小,以免造成资源的浪费。 每个线程有自己的local memory,一个block 内的线程共享share memory。启动的block 越多,每个blo
相关文章
相关标签/搜索