吴恩达《深度学习》第五课第三周

序列模型与注意力机制 3.1基础模型 1.seq2seq模型 在法译英句子中,输入的法语有5个元素,输出有6个元素。 首先我们需要构建一个编码网络,这是一个典型的RNN的结构(可以是GRU或LSTM) 每次只向网络输入一个法语单词,在接收完序列后,RNN会输出一个向量来代表输入序列X<1>到X<5>。 然后构建解码网络,以编码网络的输出作为输入,每次输出一个翻译后的单词同时作为下一个节点的输入,一
相关文章
相关标签/搜索