大数据和空间限制

1.认识布隆过滤器 题目:不安全网页的黑名单包含100亿个黑名单,每个网页URL最大占用64B。限制想要实现一直网页过滤器,可以更好网页的URL判断网页是否在黑名单上。 要求:1.允许万分之一的失误。2.使用额外空间不超过30G。 布隆过滤器:长度为m的bit类型的数组,即数组中的每个位置只占一个bit。 在假设一共有k个hash函数,这些函数的输出域s大于或者等于m,并且彼此独立优秀。输入同一个
相关文章
相关标签/搜索