CUDA编程(三)评估CUDA程序的表现

CUDA编程(三) 评估CUDA程序的表现 上一篇博客咱们基本上搭建起来了CUDA程序的骨架,可是其中并无涉及到咱们以前不断提到的并行加速,毕竟只有当咱们的程序高并行的运行在GPU上才能大大缩短运行时间。不过在加速以前咱们还有一件很是重要的事情须要考虑,那就是咱们的程序到底有没有一个好的表现,也就是咱们要准确计算程序的运行时间,这对以后的程序优化也有相当重要的做用,因此值得咱们去仔细研究一下~cs
相关文章
相关标签/搜索