Nsight Compute 使用

记录使用Nsight Compute 分析CUDA程序性能的步骤。 1.单击菜单栏上的Connet,弹出如下界面,设置要剖析的执行程序路径等运行相关参数;选择Interactive Profile模式,可以对剖析流程进行控制;所有参数设置完成后,单击Launch开始性能分析。 2.在API Stream页面控制剖析软件执行到目标核函数,然后单击菜单栏的 Profile Kernel对核函数进行剖析
相关文章
相关标签/搜索