只需一个损失函数,一个超参数即可压缩BERT,MSRA提模型压缩新方法

2020-03-13 14:37:47 机器之心报道 参与:魔王 来自武汉大学、北京航空航天大学和微软亚洲研究院的这项研究为模型压缩提供了新方向。     论文链接:https://arxiv.org/pdf/2002.02925.pdf 这篇论文提出了一种新型模型压缩方法,能够通过逐步模块替换(progressive module replacing)有效地压缩 BERT。该方法首先将原版 BE
相关文章
相关标签/搜索