图像处理中的卷积、池化、反卷积和反池化的理解与思考

卷积的理解

关于卷积在二维离散图像的可视化理解:
在这里插入图片描述
对于卷积过程中各个变量的定义:

  • 输入图像的尺寸为I
  • 图像外围的0填充padding为p
  • 卷积核的尺寸为k
  • 卷积核移动的步长stride表示为s
  • 输出图像表示为O

如上图所示,I = 5,p=1,k=3,s = 1进行卷积提取图像当中的特征,计算公式为:
O = (I − k + 2p )/s + 1

池化的理解

关于池化的可视化理解:
在这里插入图片描述
池化的计算公式和方法几乎和卷积是相同的,池化的作用主要是减小输出大小和降低过拟合。降低过拟合是减小输出大小的结果,它同样也减少了后续层中的参数的数量。

反卷积的理解

可视化理解反卷积:
在这里插入图片描述
反卷积的过程,反卷积是卷积的逆过程,又称作转置卷积。最大的区别在于反卷积过程是有参数要进行学习的(类似卷积过程),理论是反卷积可以实现UnPooling和unSampling,只要卷积核的参数设置的合理。

反卷积能够实现神经网络处理图像过程中的特征可视化,根据可视化的结果进行合理的调整网络架构
反卷积计算公式为
I = (O - 1) * s + k - 2p

反池化的理解

在这里插入图片描述

  • 图(a)表示UnPooling的过程,特点是在Maxpooling的时候保留最大值的位置信息,之后在unPooling阶段使用该信息扩充Feature Map,除最大值位置以外,其余补0。

  • 与之相对的是图(b),两者的区别在于UnSampling阶段没有使用MaxPooling时的位置信息,而是直接将内容复制来扩充Feature Map。从图中即可看到两者结果的不同。