【数据结构】一些海量数据处理问题

1. 给定一个大小超过 100G 的文件, 其中存在 IP 地址, 找到其中出现次数最多的 IP 地址(hash文件切分) 把这个100个G的文件分成1000份左右的文件,然后把这个100个G里面相同的IP地址, 使用相同的散列 函数将所有IP地址转换为一个整数key,再利用 index=key%1000就可将相同IP分到同一个文件 2. 给定100亿个整数, 找到其中只出现一次的整数(位图变形,
相关文章
相关标签/搜索