序列标注 | (7) 融入字典知识的神经中文分词

时间 2021-01-13

标签序列标注繁體版

原文原文链接

文章目录融入字典知识的神经中文分词一、背景二、主要方法融入字典知识的神经中文分词一、背景当前基于深度神经网络的中文分词方法直接从标注样本/句子中学习相关信息，缺乏处理稀有词以及和训练集来自不同领域的数据的能力。OOV(Out-of-vocabulary)问题是监督学习最主要的问题。例如，中文句子“人工智能最近很火”，它的正确分割是“人工智能/最近/很火”。然而，如果“人工智能”没有

>>阅读原文<<