CUDA:并行计算实现矩阵相加

(一)目的 熟悉基本的CUDA程序架构以及如何调用相应的API进行CUDA编程   (二)内容 完成矩阵相加的并行程序的实现(不用share memory实现) 要求: 实现2个矩阵(32*32)的相加,M矩阵的初始值全为2,N矩阵的初始值全为5。同时用CPU代码实现,比较两个代码的运行时间 实现2个矩阵(1024*1024)的相加,M矩阵的初始值全为2,N矩阵的初始值全为5。同时用CPU代码实现
相关文章
相关标签/搜索