关于xlnet的一些理解

看张俊林老师的深度学习枕边书时,一直有个疑问,Bert既然那么好, 除了transformer提取特征,使用的是双向的语言模型, 那跟单向的GPT比,肯定更好呀,为什么还会有人用GPT呢? 知道答案后,害,真是外行问题: Bert属于AE阵营,适用于语义理解等场景; GPT属于AR阵营,适用于生成文本。 两大阵营之间,发展出来了xlnet. xlnet常搜到的一句话就是: 最大化所有可能的序列的因
相关文章
相关标签/搜索