Deep learning：五十(Deconvolution Network简单理解)

时间 2019-11-05

标签 deep learning 五十 deconvolution network 简单理解栏目系统网络繁體版

原文原文链接

　　深度网络结构是由多个单层网络叠加而成的，而常见的单层网络按照编码解码状况能够分为下面3类：网络

既有encoder部分也有decoder部分：好比常见的RBM系列（由RBM可构成的DBM, DBN等），autoencoder系列(以及由其扩展的sparse autoencoder, denoise autoencoder, contractive autoencoder, saturating autoencoder等)。
只包含decoder部分：好比sparse coding, 和今天要讲的deconvolution network.
只包含encoder部分，那就是普通的feed-forward network.

　　Deconvolution network的中文名字是反卷积网络，那么什么是反卷积呢？其概念从字面就很容易理解，假设A=B*C 表示的是：B和C的卷积是A，也就是说已知B和C，求A这一过程叫作卷积。那么若是已知A和B求C或者已知A和C求B，则这个过程就叫作反卷积了，deconvolution.函数

　　Deconvolution network是和convolution network(简称CNN)对应的，在CNN中，是由input image卷积feature filter获得feature map, 而在devonvolution network中，是由feature map卷积feature filter获得input image. 因此从这点看，做者强调deconvolution network是top-down是有道理的（具体可参考Zeiler的Deconvolutional networks），看下图即可知：学习

　　上图表示的是DN(deconvolution network的简称)的第一层，其输入图像是3通道的RGB图，学到的第一层特征有12个，说明每一个输入通道图像都学习到了4个特征。而其中的特征图Z是由对应通道图像和特征分别卷积后再求和获得的。优化

　　本人感受层次反卷积网络和层次卷积稀疏编码网络（Hierarchical Convolution Sparse Coding）很是类似，只是在Sparse Coding中对图像的分解采用的是矩阵相乘的方式，而在DN这里采用的是矩阵卷积的形式。和Sparse coding中train过程交叉优化基图像和组合系数的相似，DN中每次train时也须要交叉优化feature filter和feature map.编码

　　DN的train过程：spa

　　学习DN中第l(小写的L)层网络的特征时，需优化下面的目标函数：3d

　　它是将第l层网络的输出当作第l+1层网络的输入（这和一般的deep network训练过程相似），其中的表示第l层的特征图k和第l-1层的特征图c的链接状况，若是链接则为1,不然为0. 对上面loss函数优化的思想大体为：code

固定，优化，可是这样不能直接优化（没弄清楚缘由，可参考博客下面网友的评论），所以做者引入了一个辅助变量，则这时的loss函数变为：

　上式loss函数中对辅助变量和之间的距离进行了惩罚，所以这个辅助变量的引入是合理的，接着交替优化和，直到收敛（具体可参考文章公式细节）。blog

　　2. 固定，优化，直接采用梯度降低法便可。图片

　　DN的test过程：

　　学习到每层网络的filter后，当输入一张新图片时，可一样采用重构偏差和特征图稀疏约束来优化获得本层的feature map, 好比在第一层时，需优化：

　　其中的f是在训练过程当中获得的。

　　提取出图片y的DN特征后（可多层），能够用该特征进行图像的识别，也能够将该特征从上到下一层层卷积下来获得图像y’，而这个图像y’可理解为原图像y去噪后的图像。所以DN提取的特征至少有图像识别和图像去噪2个功能。

　　不难发现，若是读者对卷积稀疏编码网络熟悉的话，也就比较容易理解反卷积网络了。同理，和sparse coding同样，DA的train过程和test过程的速度都很是慢。

读完这篇paper，不得不佩服搞数学优化的人。

　　参考资料：

　　Deconvolutional Networks, Matthew D. Zeiler, Dilip Krishnan, Graham W. Taylor and Rob Fergus.