译文 Attention Is All You Need

时间 2021-01-19

标签译文算法 nlp 自然语言处理深度学习 tensorflow 机器学习繁體版

原文原文链接

摘要主流的序列转换模型基于负责的递归或者卷积神经网络，包括编码器和解码器。性能最好的模型也是通过注意力机制链接编码器和解码器。我们提出来一种新的简单的网络结构——Transformer——仅仅基于注意力机制，完全不需要递归和卷积网络。在两个机器翻译任务上的实验表明，这些模型在质量上优于其他模型，且具有更高并发性和更少的训练时间。我们模型在WMT 2014英语翻德语的任务上取得了28.4 BLEU

>>阅读原文<<