MASS: 一统GPT和BERT的Seq to Seq框架

MASS: 一统GPT和BERT的Seq to Seq框架 MASS的功能 GPT和BERT 比较 痛点 MASS模型 模型解释 思想根源 实验 结语 MASS的功能 MASS的全名叫Masked Sequence to Sequence Pre-training for Language Generation,这个其实已经隐含了和GPT及BERT(前文有介绍)的关系: "Masked"对应了BE
相关文章
相关标签/搜索