Transformer介绍

原论文链接:https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf 首先介绍一下Encoder-Decoder 所谓encoder-decoder模型,又叫做编码-解码模型。这是一种应用于seq2seq问题的模型。 那么seq2seq又是什么呢?简单的说,就是根据一个输入序列x,来生成另一个输出序列y。seq2seq有很多的应
相关文章
相关标签/搜索