自然语言处理-中文分词

一、中文分词技术 1、常见的两类中文分词技术 中文分词技术常见的有两大类:机械分词技术、基于统计的序列标注技术。 机械分词技术操作简单、方便,比较省心,但是对于歧义词以及未登录词的效果并不是很好; 统计模型的序列标注方法,对于识别未登录词拥有较好的识别能力,而且分词精度也比较大,同时这个方法可以不分中文、英语,着重看在语言前后顺序。 以下是思维导图的形式展示两大区别: 2、深度学习在分词、找词中的
相关文章
相关标签/搜索