模型压缩一半,精度几乎无损,TensorFlow推出半精度浮点量化工具包,还有在线Demo...

鱼羊 发自 凹非寺  量子位 报道 | 公众号 QbitAI 近日,TensorFlow模型优化工具包又添一员大将,训练后的半精度浮点量化(float16 quantization)工具。python 有了它,就能在几乎不损失模型精度的状况下,将模型压缩至一半大小,还能改善CPU和硬件加速器延迟。git 这一套工具囊括混合量化,全整数量化和修剪。github 如何量化模型,尽可任君挑选。小程序 压
相关文章
相关标签/搜索