主动学习方法在临床命名实体识别应用的研究

主动学习实验框架: 1. 初始化模型产生,一般是有两种初始化抽样策略:(a)随机抽样 (b)最长句子抽样。 2. 查询: 未标注句子然后基于查询算法被排序。主要是uncertainty sampling 和diversity based algorithm。 排在前列的句子会被选择用于标注。每次循环的batch size(前多少个句子被选中)被设作8,16,32,64,128.。。。 3. 训练:
相关文章
相关标签/搜索