序列模型和注意力机制基础

时间 2021-01-13

原文原文链接

1. 序列结构的各种序列语言翻译：在给出足够多的法语和英语文本，训练这个模型确实有效。。。图像描述：这里也确实证明了AleNet模型输出的特征向量确实包含了图片的信息。总结： seq2seq模型主要来说就是由一个encoder+一个decoder构成。对于多个输出序列如何选择的问题，将在后面给出解决算法！ 2. 选择最可能的句子对于语言模型来说，一般最开始的输入是一个0向量，而机器翻