论文总结:Quantizing deep convolutional networks for efficient inference: A whitepaper

论文地址:https://arxiv.org/pdf/1806.08342.pdf 主要内容 这篇论文是篇介绍量化的综述,对量化的动机、方法等进行了较为详细的描述。 量化器的设计。作者介绍了三种量化方案:一致仿射量化器、均匀对称量化器和随机量化器。 模型量化的方法。大致可以分为两类:Post Training Quantization(训练后量化)和 Quantization Aware Trai
相关文章
相关标签/搜索