Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks

来源:NIPS 2015 本文介绍了decode时采样的一种新方法,称为“curriculum learning”(课程学习),对应的采样方法叫做“scheduled sampling”(计划采样)。 传统方法的问题:传统的神经网络训练时和预测时的输入不一样。 比如对于上图这种网络结构,训练时上一步的y是真实序列标记,然后做为输入到下一步,而预测时上一步的y是模型的输出,然后再做为下一步的输入。这
相关文章
相关标签/搜索