UGC社区敏感词过滤原理

UGC社区是以用户原创内容为主的移动互联网线上社区,其前身是网页端的bbc论坛。社区型平台天天会产生大量由用户自发造成的内容,有文字、图片、视频等形式,固然如今还有直播等形式的内容,因为用户层次的不一样,产生的内容天然就有优劣之分,同时,有人的地方就会有商机,天然不乏广告或者垃圾信息的存在,所以须要对这些东西进行过滤。算法 传统的方式是使用KMP算法对用户输入的字符串进行敏感词的匹配,而后将敏感词
相关文章
相关标签/搜索