【计算机科学】【2019.02】自然语言处理中的神经迁移学习

本文为爱尔兰国立大学(作者:Sebastian Ruder)的博士论文,共329页。 当前基于神经网络的自然语言处理模型擅长从大量标注数据中学习。鉴于这些能力,自然语言处理越来越多地应用于新任务、新领域和新语言。然而,目前的模型对噪音和对抗性的例子很敏感,并且容易过度拟合。这种脆弱性,加上注意力的消耗,挑战了有监督学习的范式。 迁移学习使我们能够利用从相关数据中获得的知识来提高目标任务的绩效,以预
相关文章
相关标签/搜索