《OpenACC并行程序设计:性能优化实践指南》一 2.6 小结

2.6 小结 OpenACC是一种描述型并行编程模型。在本章中,通过一个测试函数的应用,使用了OpenACC的多种特性来描述并行度和数据操控,并针对特定平台对代码进行了优化。尽管使用的是PGI编译器和PGProf性能调试器,但类似的优化流程也是适用于任何支持OpenACC工具包的应用的。 1.获得应用程序的性能分析结果,辨识和挖掘代码中的可并行之处。 2.逐步向编译器描述代码中可挖掘出的并行性。如
相关文章
相关标签/搜索