简单的特征值梯度剪枝,CPU和ARM上带来4-5倍的训练加速 | ECCV 2020

论文通过DBTD方法计算过滤阈值,再结合随机剪枝算法对特征值梯度进行裁剪,稀疏化特征值梯度,能够降低回传阶段的计算量,在CPU和ARM上的训练分别有3.99倍和5.92倍的加速效果   来源:晓飞的算法工程笔记 公众号 论文: Accelerating CNN Training by Pruning Activation Gradients 论文地址:https://arxiv.org/abs/1
相关文章
相关标签/搜索