海量数据面试题(位图、布隆过滤器、哈希切割)

对于处理海量数据,内存中放不下的数据通常有两种方法: 1.考虑特殊数据结构(位图、布隆过滤器) 2.切割(哈希切割、平均切割) 对于这类问题能够画图+文字+伪代码说明问题。 一:哈希切割topK问题: 给一个超过100G大小的log file,log中存放着IP地址,设计算法找到出现次数最多的IP地址?如何找到top K的IP? 对于本题采用哈希切割: 二:位图应用: **给定100亿个整数,设计
相关文章
相关标签/搜索