中文分词发展进程回顾提纲

1、基于词典的方法 1 正向最大匹配算法 1.从左向右取待切分汉语句的m个字符做为匹配字段,m为大机器词典中最长词条个数。web 2.查找大机器词典并进行匹配。若匹配成功,则将这个匹配字段做为一个词切分出来。算法 若匹配不成功,则将这个匹配字段的最后一个字去掉,剩下的字符串做为新的匹配字段,进行再次匹配,重复以上过程,直到切分出全部词为止。网络 流程以下: 机器学习 2 逆向最大匹配算法 该算法是
相关文章
相关标签/搜索