transformer模型原理

原文链接:http://jalammar.github.io/illustrated-transformer/   高级外观 让我们首先将模型看作一个黑盒子。在机器翻译应用程序中,它将使用一种语言的句子,并将其翻译输出到另一种语言中。 弹出Optimus Prime的优点,我们看到了编码组件,解码组件以及它们之间的连接。 编码组件是一堆编码器(纸张堆叠其中六个相互叠加 - 没有什么神奇的六号,一个
相关文章
相关标签/搜索