序列标注 | (6) 多标准中文分词

文章目录 多标准中文分词 一、背景 二、主要方法 多标准中文分词 一、背景 中文分词 中文分词是中文自然语言处理的基础任务,旨在辨别由连续字符组成的中文句子中的词边界。 大多数方法把中文分词转换为一个基于字符的序列标注问题,其中输入句子中的每个字符被标注为一个标签用以表示它在目标词中的位置。 多标准中文分词 尽管一些基于神经网络的中文分词方法取得了很大的进步,但是这些方法严重依赖于大规模高质量的标
相关文章
相关标签/搜索