《CUDA C编程权威指南》——3.8 习题

本节书摘来自华章计算机《CUDA C编程权威指南》一书中的第3章,第3.8节,作者 [美] 马克斯·格罗斯曼(Max Grossman),译 颜成钢 殷建 李亮,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.8 习题 1.当在CUDA中展开循环、数据块或线程束时,可以提高性能的两个主要原因是什么?解释每种展开是如何提升指令吞吐量的。 2.参考核函数reduceUnrolling8和实
相关文章
相关标签/搜索