海量数据的解决思路

1)给定100亿个整数,设计算法找到只出现一次的整数 解题思路: 使用hash将全部整数映射到1000个文件中,在每一个文件中使用位图,用两个bit表示出现次数,00表示没出现过,01表示出现过1次,10表示出现过屡次,11舍弃,最后归并每一个文件中出现只有1次的数即为所求。 2)给两个文件,分别有100亿个整数,咱们只有1G内存,如何找到两个文件交集 解题思路: (1G=2^30B=107374
相关文章
相关标签/搜索