NLP预训练模型综述

       现在深度学习越来越火了,在NLP领域主要使用CNNs、RNNs、GNNs以及attention机制。尽管这些模型取得了一些成绩,但是和CV相比,还是有些差距的,主要原因是大部分NLP任务的监督学习数据很少,而深度学习模型的参数有很多,需要大量的数据才可以学习好,否则就会发生过拟合现象,这就导致NLP模型一般都是1-3层的浅层神经网络。        近几年,预训练模型的出现在NLP领
相关文章
相关标签/搜索