序列模型和注意力机制基础

1. 序列结构的各种序列 语言翻译: 在给出足够多的法语和英语文本,训练这个模型确实有效。。。 图像描述: 这里也确实证明了AleNet模型输出的特征向量确实包含了图片的信息。 总结: seq2seq模型主要来说就是由一个encoder+一个decoder构成。 对于多个输出序列如何选择的问题,将在后面给出解决算法! 2. 选择最可能的句子 对于语言模型来说,一般最开始的输入是一个0向量,而机器翻
相关文章
相关标签/搜索