CUDA学习--矩阵乘法的并行运算

1. CUDA学习步骤 CPU实现 a*b = c 的矩阵乘法(矩阵尺寸是n*m的,n和m大于1000) 下载 https://developer.nvidia.com/cuda-downloads,安装好cuda 将cpu代码移植到cuda。将CPU值传入GPU,使用cuda计算,与cpu结果对比。 优化思路1:将矩阵分块进行计算 优化思路2:使用share memory进行优化 优化思路3:将
相关文章
相关标签/搜索