一篇理解布隆过滤器

这里只是简单介绍一下布隆过滤器的基本原理,使用方法和应用场景,不涉及任何优化问题。(其实是博主较菜,看不懂那些公式。)

1. 什么是布隆过滤器

本质上布隆过滤器是一种数据结构,比较巧妙的概率型数据结构(probabilistic data structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。

2. 底层实现

其实就是一个位数组(bit数组),只有0和1。
在这里插入图片描述

3. 如何使用

1)首先将元素装入(映射)到布隆过滤器中。使用多个不同的哈希函数生成多个哈希值,得到的哈希值就是bit数组的下标。再将下标中的值全部改为1(这里可能bit数组的值本来就是1)。这时就可以使用了
在这里插入图片描述
再存一个。(这个三个hash值中有一个是和前面那个是相同的)
在这里插入图片描述
2)判断元素是否在布隆过滤器中。对元素进行相同的hash运算,得到对应的数组下标。下标中所有值都为1时则该元素存在。

4. 特点

因为可能出现不同元素的哈希值都相同,所以在判断元素存在时,可能小概率会误判,但是判断元素不存在时,一定是准确的。

5.应用场景

1、在redis中防止缓存穿透。 2、设置较大的黑名单。 3、去重操作。