HAQ: Hardware-Aware Automated Quantization with Mixed Precision

本文的创新点为: 作者认为,在不同的平台上,以及不同的layer上,合适的量化bit数都是不同的。但是如果想认为找到这个最优值是不可能的,于是作者使用强化学习的方法来找到最合理的量化bit数。 本来芯片是不支持混合精度的计算的,但随着硬件的发展,支持混合机精度计算的芯片也出现了:比如苹果的A12,NVIDIA的图灵GPU框架等,从而使得这种思路得以实现。 它的优点是完全自动化,不需要专家知识和启发
相关文章
相关标签/搜索