海量数据处理利器之Hash——在线邮件地址过滤 - MyDetail

原帖地址:http://www.cnblogs.com/fengfenggirl/p/bloom_filter.html   标题用了了海量数据(Massive datasets)而不用大数据(Big data)。感觉大数据还是略微有点虚,来点实际的。 一、需求   现在我们需要设计一个在线过滤垃圾邮件地址的方案,我们的数据库里面已经有10亿个合法的邮件地址(称为合法地址集S),当有新的邮件发过来
相关文章
相关标签/搜索