《OpenACC并行程序设计:性能优化实践指南》一 3.7 释放主机进程

3.7 释放主机进程 下一个PIConGPU改进版本解决了已知问题,并引入了一个额外的Pthread来处理MPI通信活动(线程1-4:2)。如图3-9所示,这释放了主机进程,使其在GPU所需数据可用后立即向GPU发射任务,同时尽快地与周边的进程通信交换数据。由于Infiniband结构减少了消息延时,因此总体GPU使用率有所提高。
相关文章
相关标签/搜索