CUDA学习(三十)

主机和设备之间的数据传输: 应用程序应尽量减少主机和设备之间的数据传输。 实现这一点的一种方法是将更多的代码从主机移动到设备,即使这意味着运行低并行计算的内核。 中间数据结构可以在设备存储器中创建,由设备操作,并且在没有被主机映射的情况下被销毁或被复制到主机存储器。 而且,由于每次传输的开销比较大,所以将多次小的传输转换为一次较大的传输比较好。 在具有前端总线的系统上,通过使用页面锁定主机内存中,
相关文章
相关标签/搜索