基于倒排索引的组合敏感词过滤

1. 问题原型: 给定一段UGC文本或者网页文本,其中含有不少的敏感词或者无效词,可是有一些词只有和其余词一块儿出现的时候才算是敏感词,咱们称其为组合敏感词,须要一种算法,找到其中的组合敏感词和单个敏感词算法 2. 求解思路:   2.1 单敏感词求解:     2.1.1 暴力求解: 将文本内容逐个和设定的敏感词(如下称之为模式)进行比较,算法的复杂度为O(m*n*k),其中m为文本长度,n为模
相关文章
相关标签/搜索