cuda编程(5):优化理论

一、优化原则 最大化算术强度; 减少内存操作花费时间; 合并全局内存访问; 避免线程发散; 把高频使用数据移动到共享内存; 二、纵向 优化的流程与步骤一般包括如下步骤: 1.1 分析 分析程序的瓶颈、什么地方需要做并行、能够提供资源。不要依赖直觉,尽量借助工具: gProf VTune VerySleepy 1.2 并行 这个阶段考虑使用并行库(OpenMP是CPU上的并行,OpenACC)、指令
相关文章
相关标签/搜索