TRAINED TERNARY QUANTIZATION 论文

本文是在TWQ(Ternary Weight Quantization)的基础上做出的改进,其流程可以简单概括为: 首先将全精度权重正则化到[-1,1]之间, 然后根据一个每层相同的阈值delta_t来进行量化(这里使用统一的t是为了缩小搜索空间,用每个通道不同的t应该能得到更好的表现,但感觉会增加过多的计算消耗)为-1,0和1, Ps:还提了第二种方法,见5.1.1,但论文里没有这一节。。。 最
相关文章
相关标签/搜索