布隆过滤器原理与场景

时间 2021-01-19

原文原文链接

原理一个很长的二进制向量和一系列随机映射函数。通过设置向量数组长度与定义多种随机hash函数，正向预热数据，反向查询数据。使用的hash函数越多，区分度就越高。图解: 使用场景大数据判断是否存在：这就可以实现出上述的去重功能，如果你的服务器内存足够大的话，那么使用 HashMap 可能是一个不错的解决方案，理论上时间复杂度可以达到 O(1 的级别，但是当数据量起来之后，还是只能考虑布隆过

>>阅读原文<<