CUDA实践指南(三)

应用简介: Profile: 许多代码使用相对较少的代码完成了大部分工作。 使用探查器,开发人员可以识别这些热点,并开始编译并行化候选列表。 创建配置文件: 有很多可能的方法来分析代码,但在所有情况下,目标都是一样的:识别应用程序花费其大部分执行时间的函数或函数。 (高优先级:为了最大限度地提高开发人员的生产力,应用程序可以确定热点和瓶颈。) 任何分析活动最重要的考虑是确保工作负载是现实的 - 即
相关文章
相关标签/搜索