CUDA精讲(4)-- 性能优化

通信 vs 计算 Kepler架构来说,其峰值处理性能达到了3900Gflops,而其带宽只有250GB/s,约等于63Gflops。计算/通信约等于60。也就是说我们编写的程序达到的计算/通信极限是60左右,一般来说很难达到这个数值,但是我们需要朝着这个目标而努力。 计算/通信比还有一个叫法:Compute to Global Memory Access(CGMA)ratio。 具体来说,执行一
相关文章
相关标签/搜索