deep compression:compressing deep neural networks with pruning,trained quantization and huffman codi

deep compression:compressing deep neural networks with pruning,trained quantization and huffman coding 摘要 神经网络是计算密集型和内存密集型的,这使得它们很难部署在硬件资源有限的嵌入式系统上。为了解决这个限制,我们引入了“深度压缩”,这是一个三阶段的管道:修剪、训练量化和霍夫曼编码,它们共同工作
相关文章
相关标签/搜索