CUDA学习——Chapter 3(6)并行性实验(2)

第三章 加载吞吐量实验 上个实验介绍的是如何通过nvprof来检测SM上的占用率,现在我们来简述一下吞吐量是怎么检测的。 命令:nvprof --metrics gld_throughput <program> [param1] [param2] … 第一种情况:32*32的线程块大小: 第二种情况:32*16的线程块大小: 第三种情况:16*32的线程块大小: 第四种情况:16*16的线程块大小
相关文章
相关标签/搜索