别再蒸馏3层BERT了!变矮又能变瘦的DynaBERT了解一下

一只小狐狸带你解锁炼丹术&NLP秘籍node 神经网络模型除了部署在远程服务器以外,也会部署在手机、音响等智能硬件上。好比在自动驾驶的场景下,大部分模型都得放在车上的终端里,否则荒山野岭没有网的时候就尴尬了。对于BERT这类大模型来讲,也有部署在终端的需求,但考虑到设备的运算速度和内存大小,是无法部署完整版的,必须对模型进行瘦身压缩。git 说到模型压缩,经常使用的方法有如下几种:面试 量化:用F
相关文章
相关标签/搜索