[926]flashtext:大规模数据清洗的利器

flashText介绍 在这篇文章中,咱们将介绍一种新的关键字搜索和替换的算法:Flashtext 算法。Flashtext 算法是一个高效的字符搜索和替换算法。该算法的时间复杂度不依赖于搜索或替换的字符的数量。好比,对于一个文档有 N 个字符,和一个有 M 个词的关键词库,那么时间复杂度就是 O(N) 。这个算法比咱们通常的正则匹配法快不少,由于正则匹配的时间复杂度是 O(M * N)。这个算法
相关文章
相关标签/搜索