译文 Attention Is All You Need

摘要 主流的序列转换模型基于负责的递归或者卷积神经网络,包括编码器和解码器。性能最好的模型也是通过注意力机制链接编码器和解码器。我们提出来一种新的简单的网络结构——Transformer——仅仅基于注意力机制,完全不需要递归和卷积网络。在两个机器翻译任务上的实验表明,这些模型在质量上优于其他模型,且具有更高并发性和更少的训练时间。我们模型在WMT 2014英语翻德语的任务上取得了28.4 BLEU
相关文章
相关标签/搜索