中文分词与关键词提取概述

本文基于题库查重需求实现过程及《NLP自然语言处理原理与实践》学习过程总结得出。定有不足之处,恳请指出。 介绍 中文分词是自然语言处理(NLP)在中文环境下,首要解决的问题。主要难点为中文不同于英文,存在明确的分隔符(如空格)用于切分词语,且不同的切分方式,不一定存在语病,举个例子: 结婚的/和尚/未结婚的人。 结婚的和尚未结婚的人 基本概念 评价指标 一般,中文分词从Precision、Reca
相关文章
相关标签/搜索