中文信息处理之最大正向匹配法的评价程序改进

时间 2021-01-04

原文原文链接

一、背景昨天写的最大正向匹配法的评价程序存在如下问题：一个句子使用自己的分词方法分词，结果里边有些词汇判断是对的，但实际上是错的。如下： s = “山西山东都有西山煤电” s1 = “山西山东” 分出一个【西山】 s2 = “西山煤电” 分出一个【西山】 s1 结果显然是错的，但是我们可能划到正确的范围中二、改进方案通过初始索引和切分的字符长度来判断分割是否正确。输入：严守一把手机关了输

>>阅读原文<<