Training with Quantization Noise for Extreme Model Compression

https://arxiv.org/pdf/2004.07320.pdf 论文的核心思想如下: 针对上图进行实例分析: 如对卷积层weight为(64,64,3,3)进行量化 设置centroids数目如(32,9)其中9表示3*3卷积核的flatten 通过k-means进行选取centroids 之后进行编码(codebook),生成三个矩阵: centroids=(32,9) assignm
相关文章
相关标签/搜索