海量数据处理

1. 给定一个大小超过 100G 的文件, 其中存在 IP 地址, 找到其中出现次数最多的 IP 地址(hash文件切分)  参考哈希表知识:>哈希表(开散列)<          >哈希表(闭散列)<    解:显然我们是不可能将这100G内存直接加载到内存中去处理的,所以我们可以对大文件进行划分,将相同的IP地址会被划分在一块。假定将这个文件分为1000份,那么一个文件的大小大概为100M,然
相关文章
相关标签/搜索