【CUDA编程】学习笔记(四) GPU存储与优化

一、CPU内存 ●现代计算机体系结构面临的主要挑战 ✓如果数据无法快速移入和移出,那么快速计算将毫无意义 ✓需要大量内存用于大型应用程序 ✓非常快的内存也非常昂贵 ●最终被推向分层设计 (1)CPU内存层次结构 ●执行速度依赖于利用数据局部性 ✓时间局部性:刚刚访问的数据项很可能在不久的将来再次使用,因此请将其保留在缓存中 ✓空间局部性:相邻数据也可能很快被使用,因此加载 它们使用“宽”总线(如多
相关文章
相关标签/搜索