论文笔记：Quantizing deep convolutional networks for efficient inference: A whitepaper

时间 2020-12-30

原文原文链接

地址：https://arxiv.org/abs/1806.08342 这篇白皮书统一介绍了当前将网络进行定点化的方法。下面将看到的重点记录下来。为了降低深度神经网络的计算量以及带宽（内存占用量），一种简单可行的方式就是将浮点网络（网络权重都是float类型数值）转换成定点网络（网络权重都是或者部分是int8类型）具体来说，这么做的优势在于：不用改变网络结构，不用重新训练单个int8定点数的

>>阅读原文<<