TeaForN:让Teacher Forcing更有“远见”一些

©PaperWeekly 原创 · 作者|苏剑林 单位|追一科技 研究方向|NLP、神经网络 Teacher Forcing 是 Seq2Seq 模型的经典训练方式,而 Exposure Bias则是  Teacher Forcing 的经典缺陷,这对于搞文本生成的同学来说应该是耳熟能详的事实了。笔者之前也曾写过文章 Seq2Seq中Exposure Bias现象的浅析与对策,初步地分析过 Exp
相关文章
相关标签/搜索