tensorflow实现quantization-aware training(伪量化,fake quantization)

前面一篇文章讲模型优化的时候有讲到量化模型,但那只是量化权重,在实际计算的时候还是会反量化回去,用float32位计算,没有进行实际意义上的定点运算。今天讲的这个方式是可以部署在移动端进行定点运算的,乘现在网上关于这方面资料很少,赶紧写一篇,求赞呀~~~ 源代码位置:tensorflow/contrib/quantize/ github参考:https://github.com/tensorflo
相关文章
相关标签/搜索