Shared Memory

1、引言 在global memory部分,数据对齐和连续是提升性能的很重要的因素,当使用L1 cache的时候,对齐问题不再是问题,但是非连续的获取内存依然会降低性能。依赖于算法本质,某些情况下,非连续访问是不可避免的。使用shared memory是另一种提高性能的方式。 2、Introduction CUDA Shared Memory GPU上的memory有两种: 1、On-board
相关文章
相关标签/搜索