GPU对CNN计算的加速原理究竟是怎样的?

具体到cnn,利用gpu加速主要是在conv(卷积)过程上。conv过程同理能够像以上的向量加法同样经过cuda实现并行化。具体的方法不少,不过最好的仍是利用fft(快速傅里叶变换)进行快速卷积。NVIDIA提供了cufft库实现fft,复数乘法则能够使用cublas库里的对应的level3的cublasCgemm函数。再具体到各大框架是如何使用gpu对cnn进行加速的,目前主流的作法是使用NVI
相关文章
相关标签/搜索