浅谈模型压缩之量化、剪枝、权重共享

之前陆陆续续看了许多模型压缩相关的文章,自己业务中也接触过一些相关的客户,今天周末没事做,把模型压缩相关的内容整理一下做个分享。可能更多地从科普的角度去介绍,因为我也不是专业做这方面技术的研究。 首先明确下模型压缩的概念,就是在尽可能不改变模型效果的情况下,减少模型的体积,使得模型在使用的时候有更快的速度。 业务视角去看模型压缩的意义   模型压缩这个概念貌似是最近两年突然火了起来,究其原因,是因
相关文章
相关标签/搜索