【计算机科学】【2018.09】基于主动学习的文本分类

本文为荷兰埃因霍芬理工大学(作者:Šostak, T.)的硕士论文,共51页。 缺乏足够的训练数据一直是机器学习中的一个问题。即使有足够的数据,数据仍然需要由领域专家手动注释来构建模型。主动学习通过减少构建足够模型所需的标记数据量来加快注释过程,从而节省了人工注释者的成本和时间。 这篇论文将在不同的数据集上对已有的和新的主动学习方法进行基准测试,并提出一个主动学习系统的实现。这些数据集包含文本形式
相关文章
相关标签/搜索