Attention Is All You Need

摘要     目前的序列转化模型都是基于编码器-解码器的复杂CNN和RNN。目前最好的模型就是将编码器与解码器利用注意力机制(attention mechanism)连接起来。本文提出一种简单的模型结构,遗弃了CNN和RNN,仅仅使用注意力机制。在两个机器翻译的任务上,本文模型在性能上比现有模型好。 1.Introduction     RNN,LSTM以及gated RNN在序列模型中已经得到了
相关文章
相关标签/搜索