UGC社区敏感词过滤原理

UGC社区是以用户原创内容为主的移动互联网线上社区,其前身是网页端的bbc论坛。社区型平台每天会产生大量由用户自发形成的内容,有文字、图片、视频等形式,当然现在还有直播等形式的内容,由于用户层次的不同,产生的内容自然就有优劣之分,同时,有人的地方就会有商机,自然不乏广告或者垃圾信息的存在,因此需要对这些东西进行过滤。 传统的方式是使用KMP算法对用户输入的字符串进行敏感词的匹配,然后将敏感词删除或
相关文章
相关标签/搜索