gpu排序

单机版的双调排序可以参考 http://blog.csdn.net/sunmenggmail/article/details/42869235 还是这张图片 基于cuda的双调排序的思路是: 为每一个元素提供一个线程,如果大于1024个元素,还是提供1024个线程,这是因为__syncthreads只能作为block内的线程同步,而一个block最多有1024个线程,如果元素个数大于1024则每个
相关文章
相关标签/搜索