压缩神经网格(二):融合分支的思想

DeepRebirth: A General Approach For Accelerating deep neural Network Execution on mobile devices 研究背景 通过权重压缩后的神经网络,虽然模型的大小变小了,但是执行时间和耗能上性能还是一般。我们发现,不含tensor参数的层(non-tensor层)的执行时间很长,基于这个问题,论文中提出了两种将non
相关文章
相关标签/搜索