论文地址:https://arxiv.org/abs/1602.07360
模型地址:https://github.com/DeepScale/SqueezeNetgit
1. 论文思想
提出一种新的卷积组合方式替代原来的3*3的卷积。相似于bottleneck layer减小参数数目。可是不太像MobileNet是提出了一种新的卷积计算方式来减小参数,加速计算。github
2. 网络结构设计策略
- 用3*3的替代1*1的filter。 (NiN, GoogLeNet)
- 减小3*3的输入channel数目。 (bottleneck layer)
- 延迟下采样(so that convolution layers have large activation maps. (He & Sun)
3. 组合方式

squeeze中的1*1的卷积为了减小输入到3*3中的channel数目网络
expand中的1*1和3*3的卷积,也算是一种效果的综合吧。(不能全是3*3的,否则论文就没有什么创新了。不能全是1*1的卷积,估计会影响效果。)设计
4. 网络结构

- SqueezeNet
- SqueezeNet with simple bypass(相似于ResNet,由于要作加操做,要求两个输入的channel num同样,因此只能在某些层加bypass)
- SqueezeNet with complex bypass(添加1*1的卷积,打破上面那个限制)

- compression info 应用的是Deep compression里面的稀疏性和量化的方法。
5. 组合方式探索
探索了几个超参数不一样组合方式对网络大小以及准确率的影响。3d
结果blog

6. 总结
- 在AlexNet上实现了50x的缩减,模型大小小于0.5MB。
- 探索较深网络的时候,能够尝试这种方法。
- 又是一篇在1*1的卷积上作工做的文章。(MobileNet, ShuffleNet)