中文信息处理之最大正向匹配法的评价程序改进

一、背景 昨天写的最大正向匹配法的评价程序存在如下问题:一个句子使用自己的分词方法分词,结果里边有些词汇判断是对的,但实际上是错的。如下: s = “山西山东都有西山煤电” s1 = “山西山东” 分出一个【西山】 s2 = “西山煤电” 分出一个【西山】 s1 结果显然是错的,但是我们可能划到正确的范围中 二、改进方案 通过初始索引和切分的字符长度来判断分割是否正确。 输入:严守一把手机关了 输
相关文章
相关标签/搜索