机器学习与深度学习系列连载: 第二部分 深度学习(二十) 轮询采样 Scheduled Sampling

计划采样 Scheduled Sampling 和 强化学习辅助 当我们用Seq2Seq模型进行训练和测试的时候,很容易遇到Mismatch的问题,因为训练的时候,不同的timestep输入的是groudTruth的值,但是测试的时候,不同的timestep输入的是生成的值。具体我们看下面的解释。 1. 训练和测试的Mismatch 训练的时候: 测试的时候: Testing: The input
相关文章
相关标签/搜索