分析高阶问题

摘要:当前方法经常使用单阶设定当处理序列标签任务。在本工作中,order意味着标签的个数,包含在每个时间步中的预测。高阶模型试图去捕获更多依赖信息在这些标签之间。我们首先提出一个简单方法就是低阶模型可以简单的拓展到高阶模型。惊奇的是,高阶模型被认为捕获更多依赖信息当增加阶数时表现更差。我们认为强迫网络去学习复杂结构会导致过拟合。为了处理这个问题,我们提出一种方法能够结合低阶和高级信息一起去解码。提
相关文章
相关标签/搜索