unet网络讲解,附代码

转:html

http://www.cnblogs.com/gujianhan/p/6030639.html数组

key1:网络

FCN对图像进行像素级的分类,从而解决了语义级别的图像分割(semantic segmentation)问题。与经典的CNN在卷积层以后使用全链接层获得固定长度的特征向量进行分类(全联接层+softmax输出)不一样,FCN能够接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸,从而能够对每一个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。最后逐个像素计算softmax分类的损失, 至关于每个像素对应一个训练样本。函数

key2:性能

CNN的强大之处在于它的多层结构能自动学习特征,而且能够学习到多个层次的特征:较浅的卷积层感知域较小,学习到一些局部区域的特征;较深的卷积层具备较大的感知域,可以学习到更加抽象一些的特征。这些抽象特征对物体的大小、位置和方向等敏感性更低,从而有助于识别性能的提升。这些抽象的特征对分类颇有帮助,能够很好地判断出一幅图像中包含什么类别的物体,可是由于丢失了一些物体的细节,不能很好地给出物体的具体轮廓、指出每一个像素具体属于哪一个物体,所以作到精确的分割就颇有难度。学习

key3:spa

全链接层和卷积层之间惟一的不一样就是卷积层中的神经元只与输入数据中的一个局部区域链接,而且在卷积列中的神经元共享参数。然而在两类层中,神经元都是计算点积,因此它们的函数形式是同样的。所以,将此二者相互转化是可能的:.net

  • 对于任一个卷积层,都存在一个能实现和它同样的前向传播函数的全链接层。权重矩阵是一个巨大的矩阵,除了某些特定块,其他部分都是零。而在其中大部分块中,元素都是相等的。htm

  • 相反,任何全链接层均可以被转化为卷积层。好比,一个 K=4096 的全链接层,输入数据体的尺寸是 77512,这个全链接层能够被等效地看作一个 F=7,P=0,S=1,K=4096 的卷积层。换句话说,就是将滤波器的尺寸设置为和输入数据体的尺寸一致了。由于只有一个单独的深度列覆盖并滑过输入数据体,因此输出将变成 114096,这个结果就和使用初始的那个全链接层同样了blog

key4:

通过屡次卷积和pooling之后,获得的图像愈来愈小,分辨率愈来愈低。其中图像到 H/32W/32 的时候图片是最小的一层时,所产生图叫作heatmap热图,热图就是咱们最重要的高维特诊图,获得高维特征的heatmap以后就是最重要的一步也是最后的一步对原图像进行upsampling,把图像进行放大、放大、放大,到原图像的大小。最后的输出是1000张heatmap通过upsampling变为原图大小的图片,为了对每一个像素进行分类预测label成最后已经进行语义分割的图像,最后经过逐个像素地求其在1000张图像该像素位置的最大数值描述(几率)做为该像素的分类。所以产生了一张已经分类好的图片。

key5:

把原来CNN操做中的全链接变成卷积操做conv六、conv7,图像的featureMap数量改变可是图像大小依然为原图的1/32,此时图像再也不叫featureMap而是叫heatMap。

key6:

如今咱们有1/32尺寸的heatMap,1/16尺寸的featureMap和1/8尺寸的featureMap,1/32尺寸的heatMap进行upsampling操做以后,由于这样的操做还原的图片仅仅是conv5中的卷积核中的特征,限于精度问题不可以很好地还原图像当中的特征,所以在这里向前迭代。把conv4中的卷积核对上一次upsampling以后的图进行反卷积补充细节(至关于一个差值过程),最后把conv3中的卷积核对刚才upsampling以后的图像进行再次反卷积补充细节,最后就完成了整个图像的还原。

 

questions:

举个栗子:若是咱们想让224×224尺寸的浮窗,以步长为32在384×384的图片上滑动,把每一个经停的位置都带入卷积网络,最后获得6×6个位置的类别得分。上述的把全链接层转换成卷积层的作法会更简便。若是224×224的输入图片通过卷积层和下采样层以后获得了[7x7x512]的数组,那么,384×384的大图片直接通过一样的卷积层和下采样层以后会获得[12x12x512]的数组。而后再通过上面由3个全链接层转化获得的3个卷积层,最终获得[6x6x1000]的输出((12 – 7)/1 + 1 = 6)。这个结果正是浮窗在原图经停的6×6个位置的得分!

代码:

http://blog.csdn.net/u012931582/article/details/70215756

 

 

计算机视觉中几种上采样方法

http://blog.csdn.net/u014451076/article/details/79156967

https://www.zhihu.com/question/43609045?sort=created

http://blog.csdn.net/zsz_shsf/article/details/53201669 托普利兹矩阵

相关文章
相关标签/搜索