不得了的Transformer模型(一)简单介绍

一、Transformer模型的简单介绍 Transformer是由大厂Google发布的,完全基于attention机制的强大的模型,它的出现使的机器翻译等领域出现了突破性的进展。我们可以通过《Attention Is All Y ou Need》论文来了解这个强大的模型到底是个啥。 二、Transformer模型的结构 2.1 Encoder and Decoder stacks       
相关文章
相关标签/搜索