NLP数据加强方法总结:EDA、BT、MixMatch、UDA

1. 数据加强的背景和应用场景 随着AI技术的逐步发展,更好的神经网络模型对数据规模的要求也逐步提高。而在分类任务中,若不一样类别数据量相差很大,模型则会出现过拟合现象,严重影响预测的正确性。python 从广义上来说,有监督模型的效果相对半监督或无监督学习都是领先的。可是有监督模型须要获取大量的标注数据,当数据需求达到十万、百万甚至更多时,人工标注数据昂贵的代价已经让不少人望而却步。nginx
相关文章
相关标签/搜索