cuda编程(2):软硬件编程模型以及高效策略

原视频 一、相关概念 多个线程组成线程块,多个线程块组成网格,网络约等于kernel。而kernel是GPU处理的最小单元,可以理解成是一个函数。如下图: CPU和GPU硬件对比: CPU和GPU编程: 二、高效策略 根据公式,有以下五种方式: 高效策略-合并全局内存 其他方式-避免线程发散: 其他方式-避免循环长度不一样
相关文章
相关标签/搜索