测试面试

给定a、b两个文件,各存放50亿个url,每个url各占用64字节,内存限制是4G,如何找出a、b文件共同的url? 方法2: 分别扫描A,B两个文件,根据hash(url)%k(k为正整数,比如k = 1000,那么每个小文件只占用300M,内存完全可以放得下)将url划分到不同的k个文件中,比如a0,a1,…a999;b0,b1,…b999; 这样处理后相同的url肯定在对应的小文件中(a0
相关文章
相关标签/搜索