《CUDA C编程权威指南》——2.3 组织并行线程

本节书摘来自华章计算机《CUDA C编程权威指南》一书中的第2章,第2.3节,作者 [美] 马克斯·格罗斯曼(Max Grossman),译 颜成钢 殷建 李亮,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.3 组织并行线程 从前面的例子可以看出,如果使用了合适的网格和块大小来正确地组织线程,那么可以对内核性能产生很大的影响。在向量加法的例子中,为了实现最佳性能我们调整了块的大小,并
相关文章
相关标签/搜索