Attention is all you need论文Transformer中的Positional Encoding代码实现及讲解

时间 2020-12-30

标签 nlp transformer 繁體版

原文原文链接

首先论文中说到因为没有用到RNN也没有用到CNN提取特征，所以句子中没有很好的应用位置信息。所以需要在input embedding后加上Positional Encoding 。所以论文中提出了一种Positional Encoding的实现方式，下面贴出代码的实现以及讲解。首先看下论文中提出的方式，pos为词的位置信息，dmodel为词向量embedding的维度。最后得到的向量大小取值

>>阅读原文<<