自然语言处理期末复习(2)中文分词

1.汉语分词:通过计算机程序把组成汉语文本的字串自动转换 为词串的过程被称为自动切分 2.汉语切分的原因:(1)语音的合成(2)信息检索(3)词语计量分析 3.汉语分词基本方法:(1)基于词表的方法(2)字序列标记方法 4.最大匹配法: (1)  正向最大匹配法(MM) 从左向右匹配词表 (2)  逆向最大匹配法(RMM) 从右向左匹配词表 5.歧义的类型 (1)交集型歧义:AJ/B、A/JB 交
相关文章
相关标签/搜索