Training with Quantization Noise for Extreme Model Compression

https://arxiv.org/pdf/2004.07320.pdf 论文的核心思想以下:web 针对上图进行实例分析: 如对卷积层weight为(64,64,3,3)进行量化网络 设置centroids数目如(32,9)其中9表示3*3卷积核的flatten 经过k-means进行选取centroids 以后进行编码(codebook),生成三个矩阵:svg centroids=(32,9)
相关文章
相关标签/搜索