序列生成(sequence generate)架构

序列生成架构: decoder模型: 1.1 模型架构图: 1.2 数据流: 数据形式:使用历史token序列预测当前时刻 t 下一个时刻 t+1 时刻。 训练数据形式:假设有一段token序列X,那么input_sequence = X[:-1],lable_sequence = X[1:],原则就是使用当前时刻的历史hidden state info和当前token作为模型(模型可是RNN或t
相关文章
相关标签/搜索