BERT模型

时间 2020-12-30

原文原文链接

BERT模型是2018年的10月Google发布的论文《Pre-training of Deep Bidirectional Transformers for Language Understanding》，提到的BERT模型刷新了自然语言处理的11项记录模型架构 ELMO(Embedding from Language Models),采用的双向的Bi-LSTM实现的，图中左端的前向双层LST