序列标注 | (7) 融入字典知识的神经中文分词

文章目录 融入字典知识的神经中文分词 一、背景 二、 主要方法 融入字典知识的神经中文分词 一、背景 当前基于深度神经网络的中文分词方法直接从标注样本/句子中学习相关信息,缺乏处理稀有词以及和训练集来自不同领域的数据的能力。OOV(Out-of-vocabulary)问题是监督学习最主要的问题。 例如,中文句子“人工智能最近很火”,它的正确分割是“人工智能/最近/很火”。然而,如果“人工智能”没有
相关文章
相关标签/搜索