敏感词过滤算法:前缀树算法

背景node 平时咱们在逛贴吧、牛客网的时候,咱们常常能够看到一些形如 “***”的符号,经过上下文,咱们也能够很容易猜到这些词原来是骂人的话,只是被系统和谐了。那么这是如何实现的呢?做为普通人,咱们最早想到的一种办法就是把全部敏感串存入一个列表中,而后用户每发一条内容后台就把该内容与敏感串列表的每一项进行匹配,而后把匹配的字符进行和谐。显然这样的效率是很低的。很是影响性能,那么咱们有没有其余的算
相关文章
相关标签/搜索