EDA 文本增强(和我的思考)

EDA: Easy Data Augmentation 文章结构:原理、设置参数、代码。 一、原理 文章来源:https://arxiv.org/abs/1901.11196 通过对文本中部分词的改变,达到重写文本,让样本数量增多的目的,并增强对应训练模型的泛化能力。 具体有四种方式: 1、同义词替换:在句子中的词中随即选择n个非停用词。将每个词换成一个随即的同义词。 2、随机插入:在句子中的词中
相关文章
相关标签/搜索