ESPNet

ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segme网络


2019/03/11 Author:Yu Zhang架构

此篇论文为ECCV2018中的一篇论文,做者介绍了一个既快又效果说得过去的网络架构,用于语义分割当中。此网络能够达到每秒112帧,比目前有效的轻型网络如MobileNet,ShuffleNet, ENet等等都要快,还好,在只下降8%精度的条件下,比PSPNet小180倍,速度快22倍。性能

那么做者是怎么作到的呢?测试

ESP

上图为ESP的架构,看起来很是复杂,但其实操做很简单,首先使用逐点卷积将通道数进行缩减,缩减后送入空洞卷积金字塔,经过不一样rate的空洞卷积得到更大感觉野并进行融合,参数很是少,由于通道减小以后,每个空洞卷积的参数都是不多的。具体通道及rate以及拼合策略如图所示。拼合策略与普通空洞卷积特征融合的方法不一样,这里为了不gridding artifacts现象,采用了逐级相加的策略。编码

设计的分割网络以下图:设计了一个轻量级的编码解码网络架构spa

structure

在cityscapes测试集上能达到60.3的准确率,已经不错了。 同时做者作了特别多的实验,感兴趣的能够到原文中去看。设计


在18年11月份,ESPNet做者又发布了ESPNetv2,继续缩小网络,并在分类,分割,语言模型三个任务中取得不错的效果。咱们看一下他的结构:
structureci

与ESPNet不一样的地方是:rem

  • 一开始的普通1x1conv 降维变为了1x1 group conv,这会减小参数
  • 中间的空洞卷积变为深度可分离空洞卷积DDConv
  • A方案会在相加后再接一层1x1conv而后再concat, B方案直接concat不事后面再跟一个1x1 groupconv

实验结果我只帖分割结果,以下图:
resultsget

能够看到比ESPNet参数少了4倍,性能只下降了6%

相关文章
相关标签/搜索