最前沿的12个NLP预训练模型

1 引言 17年transformer被提出,18年迎来了ELMo和BERT的横空出世,19年预训练模型不出意外地开始了全面的爆发。 所以,预训练模型也成为了NLPer绕不过去的一个技术栈,这篇文章将会梳理一下我学习过的12个预训练模型。这是一篇review性质的文章,跳过了一些基础的知识,可能会对一些没用过预训练模型的读者不大友好。 预训练模型,在我看来,相对传统模型做的革新,主要体现在以下三个
相关文章
相关标签/搜索