《OpenACC并行程序设计:性能优化实践指南》一 3.8 优化GPU内核

3.8 优化GPU内核 现在GPU大部分时刻都是忙碌的,那么是否可以减少GPU计算时间?如图3-9所示,使用函数摘要只显示CUDA函数信息。可以看出,主要耗时的内核是“moveParticles”,第二耗时内核是“cptCurrent”。两个内核的共同部分是都需要遍历粒子列表,先积累对粒子的总电流影响(cptCurrent),然后更新粒子的位置(moveParticles)。可见,原来使用的链表数
相关文章
相关标签/搜索