预训练语言模型 | (3) Bert

目录 1. 背景 2. Bert流程和技术细节 3. 总结 1. 背景 在bert之前,将预训练的embedding应用到下游任务的方式大致可以分为2种,一种是feature-based,例如ELMo这种将经过预训练的embedding作为特征引入到下游任务的网络中;一种是fine-tuning,例如GPT这种将下游任务接到预训练模型上,然后一起训练。然而这2种方式都会面临同一个问题,就是无法直接
相关文章
相关标签/搜索