NLP基础之——Contextual Word Representations and Pretraining

时间 2020-12-24

标签理论笔记人工智能自然语言处理 nlp 栏目 Microsoft Office 繁體版

原文原文链接

一、ELMO ELMO的基本思想是利用双向的LSTM结构，对于某个语言模型的目标，在大量文本上进行预训练，从LSTM layer中得到contextual embedding，其中较低层的LSTM代表了比较简单的语法信息，而上层的LSTM捕捉的是依赖于上下文的语义信息。ELMO的全称就是Embeddings from Language Models。对于下游的任务，再将这些不同层的向量线性组合，再

>>阅读原文<<