测试minpy 调用gpu 加速矩阵相乘. accelerate matrix multiplication

测试minpy 调用gpu加速矩阵相乘,已经写了几篇文章.前几篇文章得到的结果不太好,主要原因是跟想象中的结果并不是很相同. 主要有两点,一个是前几篇测试加速的效果并不是很好,矩阵要很大的时候才能看到明显的加速.另一个是我一个先验的经验认为float32的加速效果要明显比float64的加速效果要好很多. 但是这两点在前面的测试中并没有得到. 这个就能感受到理论跟实验之间差距.如果你相信理论,相信
相关文章
相关标签/搜索