文本增强技术

参考资料熵简科技-李渔博士的报告《文本增强技术的研究进展及应用实践》 背景 本质上是增加少类样本(数量少或者类型单一)的数量 具体场景包括 少样本场景(如文本标注耗时耗力很难获取很多) 分类任务中样本不均衡(note:常见方法-欠采样 ( undersampling ) 和过采样 ( oversampling ) 会对模型带来怎样的影响?) 半监督训练(19年google半监督学习算法 UDA 可
相关文章
相关标签/搜索