transformer模型详解

翻译自 https://jalammar.github.io/illustrated-transformer/ Transformer模型结构 Transformer的主体结构图: 编码器解码器 模型分为编码器和解码器两个部分。 编码器由6个相同的层堆叠在一起,每一层又有两个支层。第一个支层是一个多头的自注意机制,第二个支层是一个简单的全连接前馈网络。在两个支层外面都添加了一个residual的连
相关文章
相关标签/搜索