深度学习基础--卷积--加速的卷积运算

加速的卷积运算   convolution在GPU上如何实现,文中介绍了三种方法 1)最直观的方法是直接实现(即一般的卷积运算)   缺点:这种实现呢需要处理许多的corner case。   文中介绍cuda-convnet2是实现了该种方法,该种方法在不同取值的卷积参数空间效率不一,比如batch size > 128,效率很高,但是如果batch size < 64, 效率比较低。 2)采用
相关文章
相关标签/搜索