语言模型串烧

语言模型串烧 Word2Vec(2013年1月) GloVe(2014年1月) FastText(2016年7月) Transformer(2017年6月) Positional Encoding Multi-head self attention Fully connected feed forward ELMo(2018年2月) BERT(2018年10月) Transformer-XL(20
相关文章
相关标签/搜索