Trained Ternary Quantization

本文是在TWQ(Ternary Weight Quantization)的基础上做出的改进,其流程可以简单概括为: 首先将全精度权重正则化到[-1,1]之间,然后根据一个每层相同的阈值t来进行量化(这里使用统一的t是为了缩小搜索空间,用每个通道不同的t应该能得到更好的表现,但感觉会增加过多的计算消耗)为-1,0和1,最后分别乘以Wn和Wp作为结果计算loss,再通过梯度下降更新Wn、Wp和原始梯度
相关文章
相关标签/搜索