NLP论文笔记:Easy Data Augmentation Techniques for Boosting Performance on Text Classification Task

代码:eda EDA 文中提到了4种数据增强技术 用于文本分类任务,并用了2种常用的文本分类的深度学习模型在5个benchmark上跑了一下分类(5个banckmark: SST-2, CR, SUBG, TREC, PR), 在跑模型的时候作者将训练集分为3种规模大小 从而比较EDA技术在训练数据集规模上的影响。 4种数据增强技术: 同义词替换 随机插入 随机交换 随机删除 5个banckmar
相关文章
相关标签/搜索