[论文阅读笔记 --- 13] StructBERT: Incorporating Language Structures into Pre-training for Deep Language Un

Bert 预训练思路 Bert 预训练模型 Bert 预训练两大子任务 Mask Token Prediction: 对于Mask的位置,多分类任务,从此表中预测处正确的词 Next Sentence Prediction: 输入两个句子,判断S1和S2是否是上下句的关系。 Mask Token Prediction Next Sentence Prediction StructBert 对于单个
相关文章
相关标签/搜索