论文笔记:Quantizing deep convolutional networks for efficient inference: A whitepaper

地址:https://arxiv.org/abs/1806.08342 这篇白皮书统一介绍了当前将网络进行定点化的方法。下面将看到的重点记录下来。 为了降低深度神经网络的计算量以及带宽(内存占用量),一种简单可行的方式就是将浮点网络(网络权重都是float类型数值)转换成定点网络(网络权重都是或者部分是int8类型)具体来说,这么做的优势在于: 不用改变网络结构,不用重新训练 单个int8定点数的
相关文章
相关标签/搜索