深度学习模型压缩与优化加速(Model Compression and Acceleration Overview)

1. 简介 深度学习(Deep Learning)因其计算复杂度或参数冗余,在一些场景和设备上限制了相应的模型部署,须要借助模型压缩、优化加速、异构计算等方法突破瓶颈。node 模型压缩算法可以有效下降参数冗余,从而减小存储占用、通讯带宽和计算复杂度,有助于深度学习的应用部署,具体可划分为以下几种方法(后续重点介绍剪枝与量化): 线性或非线性量化:1/2bits, int8 和 fp16等; 结构
相关文章
相关标签/搜索