Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization

本文提出了一种使用随机算法量化网络的方法。 它的思路类似INQ,都是将权重划分为被量化的和全精度部分,然后逐次增加量化的比例,直到百分百。不同之处在于量化权重的选取:INQ是按照从大到小的顺序进行量化,而本文则根据量化误差的大小选取: 这里Wi是某通道权重的全精度值,Qi是其量化后的值。作者定义一个函数: 作者依据该函数提出了四种量化方案: 1:量化概率为1/m,m为权重的通道数。 2:线性函数
相关文章
相关标签/搜索