【论文阅读笔记】Incremental Network Quantizatio:Towards Lossless CNNs with Low-Precision Weights

全文概括   先前的量化方法(同时量化所有的weight)都太粗暴了,这导致了量化损失严重,作者提出一种分组量化-分组re-train的方法来拟补量化带来的损失。   INQ方法步骤: 将为量化的参数分成 待量化/待re-train组(用超参数定义每次量化的百分比,百分比会自动在参数中找到一个临界点,绝对值大于这个临界点的分为待量化组 ,因为作者认为大值比小值重要,让小的re-train。这个观点
相关文章
相关标签/搜索