XLNet简介

背景知识 语言模型:自回归和自编码模式 图示: 黄色块为输入字符,蓝色块为字符的位置。 对于自回归语言模型,它希望通过已知的前半句预测后面的词或字。 对于自编码语言模型,它希望通过一句话预测被 Mask 掉的字或词,如上所示第 2 个位置的词希望通过第 1、3、5 个词进行预测。 自回归式的优缺点 计算效率比较高 只能编码单向语义 自编码式的优缺点 双向编码能力 BERT 假设要预测的词之间是相互
相关文章
相关标签/搜索