网络量化——Quantized Convolutional Neural Networks for Mobile Devices

时间 2019-12-13

标签网络量化 quantized convolutional neural networks mobile devices 栏目系统网络繁體版

原文原文链接

论文地址：https://arxiv.org/abs/1512.06473
源码地址：https://github.com/jiaxiang-wu/quantized-cnngit

1. 主要思想

这篇文章的主要思想其实就是权值共享，也是用聚类的方法(k-means)作共享，只不过不是单个权值共享了，而是分块权值共享(用一个掩码矩阵表示共享的状况)，所以能够较少存储空间。再加上由于共享，因此有些点乘计算只须要计算一次，由于对应的权值块都同样，输入同样的话，输出也同样。因此将部门的点乘转换成了加法操做。所以也能够作到加速。

2. 性能

ILSVRC-12上4~6x speed-up.
15~20x compression.
one percentage loss of classification accuracy.

3. 量化原理

Weighting Matrix 被划分红不少块，而后经过聚类(k-means)获得codebook，聚类操做优化的目标函数是：

也就是说codebook乘上掩码矩阵是能够大体恢复到Weighting Matrix。github

4. 量化全链接层

就是聚类的目标函数，以及参数的还原。函数

5. 量化卷积层
就是聚类的目标函数，以及参数的还原。性能

6. 优化目标
定义损失函数，用于更新聚类获得的codebook优化

7. 参数更新方法

迭代更新的过程。

8. 计算量

9. 实验结果

10. 结论

实践代表聚类在实际应用中的效果仍是很明显的，尤为是在全链接层，由于参数很是的冗余，因此几乎不用作fine-tuning，就能够恢复到原来的性能，卷积层可能须要作fine-tuning。

相关文章

相关标签/搜索

jQuery Mobile 教程

网站品质教程

网站建设指南

代码格式化

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<