NLP学习-词形标准化

首先说一下文本分析流程: 下面讲述词形标准化的相关内容。 在清洗过程中,我们说到了一个处理,就是同音近音近型替换也就是词形规范化,这里就讲述两种实现的方法,如下 词干提取(Stemming):基于语言的规则,抽取词的词干或词根形式(不一定能够表达完整语义),方法较为简单。 词性还原 (Lemmatisation):基于字典的映射,把一个词汇还原为一般形式(能表达完整语义),方法较为复杂。 (个人也
相关文章
相关标签/搜索