深度学习的Attention模型

时间 2021-01-12

原文原文链接

前言前面看到谷歌发表的运用在机器翻译上的论文《Attention is all you need》，很是让人惊讶，这是一种全新的模型，与之前的经典的seq2seq模型改动较大，它完全摒弃了RNN或CNN神经网络，大大简化了模型的复杂度，而且效果还相当好。当然Attention模型可以单独使用，但这篇文章我们来看看Attention的机制及怎么与经典的seq2seq结合。 seq2seq 前面我们