复旦大学邱锡鹏教授：NLP预训练模型综述

时间 2021-07-12

原文原文链接

©PaperWeekly 原创 · 作者｜王馨月学校｜四川大学本科生研究方向｜自然语言处理引言随深度学习的发展，多种神经网络都被应用在 NLP 任务中，比如 CNN、RNN、GNN 和 attention 机制等，但由于现有的数据集对于大部分有监督 NLP 任务来说都很小，因此，早期的模型对 NLP 任务来说都很“浅”，往往只包含 1-3 层。而预训练模型（Pre-trained Mod