【论文精读】The Devil is the Classifier: Investigating Long Tail Relation Classification with Decoupling

这篇文章是浙江大学2020年9月15号推到Arxiv上的。 文章的初始出发点应该是来自,关系抽取数据集由于数据存在长尾特征,因此直接从数据中学习语义,必定是不均衡的【样本多的语义容易过拟合某个类别中的头部样本,样本少的语义容易过拟合某个类别中的单个样本】。 因此采用引入外部预训练的词向量来进行语义embedding就说得通。 同时又知道,我们有三种采样的方式,来进行长尾数据集的再平衡,即将长尾数据
相关文章
相关标签/搜索