ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segme网络
2019/03/11 Author:Yu Zhang架构
此篇论文为ECCV2018中的一篇论文,做者介绍了一个既快又效果说得过去的网络架构,用于语义分割当中。此网络能够达到每秒112帧,比目前有效的轻型网络如MobileNet,ShuffleNet, ENet等等都要快,还好,在只下降8%精度的条件下,比PSPNet小180倍,速度快22倍。性能
那么做者是怎么作到的呢?测试
上图为ESP的架构,看起来很是复杂,但其实操做很简单,首先使用逐点卷积将通道数进行缩减,缩减后送入空洞卷积金字塔,经过不一样rate的空洞卷积得到更大感觉野并进行融合,参数很是少,由于通道减小以后,每个空洞卷积的参数都是不多的。具体通道及rate以及拼合策略如图所示。拼合策略与普通空洞卷积特征融合的方法不一样,这里为了不gridding artifacts现象,采用了逐级相加的策略。编码
设计的分割网络以下图:设计了一个轻量级的编码解码网络架构spa
在cityscapes测试集上能达到60.3的准确率,已经不错了。 同时做者作了特别多的实验,感兴趣的能够到原文中去看。设计
在18年11月份,ESPNet做者又发布了ESPNetv2,继续缩小网络,并在分类,分割,语言模型三个任务中取得不错的效果。咱们看一下他的结构:ci
与ESPNet不一样的地方是:rem
实验结果我只帖分割结果,以下图:get
能够看到比ESPNet参数少了4倍,性能只下降了6%