pytorch量化中torch.quantize_per_tensor()函数参数详解

torch.quantize_per_tensor(input,scale, zero_point, dtype)实现8位量化: 摘要:对该函数各个参数的分析 量化: 计算机运算时,默认32位浮点数,若将32位浮点数,变成8位定点数,会快很多。 目前pytorch中的反向传播不支持量化,所以该量化只用于评估训练好的模型,或者将32位浮点数模型存储为8位定点数模型,读取8位定点数模型后需要转换为32
相关文章
相关标签/搜索