【CUDA编程】学习笔记(三) CUDA软件抽象机制

一、多线程 (1)设计理念 CPU是面向延迟的核心,尽可能快完成计算任务 GPU是面向吞吐量的核心,通过多个线程实现在某一段时间内的高吞吐率 打个比喻,前者是一架飞机,后者是一千辆牛车 可以看到,CPU的Cache更大,通过复杂的控制逻辑实现性能优化,而GPU的控制逻辑相对简单,通过多线程来实现高吞吐率 (2)多线程 CPU中的SIMD ✓所有内核同时执行相同的指令,但数据不同 ✓类似于CRAY超
相关文章
相关标签/搜索