高效Java实现敏感词过滤算法工具包

2.0版本提供更高效的标点符号的判断跳过过程 旧版请参考本人2011年博文:高效Java敏感词、关键词过滤工具包_过滤非法词句 本文是Java敏感词过滤的原理以及工具包的提供地址,原理:基于多叉树的查找。 第一步:把敏感词读入搜索多叉树中, 树结构:   第二步,对需过滤的句子进行逐字匹配: 比如句子:解放了全中国 1、记录起始位置start=0,读到了“解”,匹配了搜索树中起始节点的的“解”字;
相关文章
相关标签/搜索