JavaShuo
栏目
标签
给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
时间 2021-01-20
标签
java面试
栏目
HTTP/TCP
繁體版
原文
原文链接
采用分治的思想 假如每个url大小为64bytes,那么可以估计每个文件的大小为50G×64=320G,远远大于内存限制的4G,所以不可能将其完全加载到内存中处理,可以采用分治的思想来解决。 Step1:遍历文件a,对每个url求取hash(url)%1000,然后根据所取得的值将url分别存储到1000个小文件(记为a0,a1,...,a999,每个小文件约300M); Step2:
>>阅读原文<<
相关文章
1.
给定a、b两个文件,各存放50亿个url,每个url各占64字节
2.
面试- 阿里-. 大数据题目- 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
3.
给定a、b两个文件,各存放50亿个url,每一个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
4.
给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
5.
海量数据面试题整理1.给定a、b两个文件,各存放50亿个url,每一个url各占64字节,内存限制是
6.
有10 亿个 url,每一个 url 大小小于 56B,要求去重,内存只给你4G
7.
海量数据实战(0)从两个文件50亿数据中找出相同的URL
8.
jsp url文件判断是否存在
9.
php-获取URL的各个段的值
10.
一个英文字母,一个中文各占多少字节?
更多相关文章...
•
PHP 表单 - 验证邮件和URL
-
PHP教程
•
Thymeleaf标准URL语法
-
Thymeleaf 教程
•
三篇文章了解 TiDB 技术内幕——说存储
•
Docker容器实战(七) - 容器眼光下的文件系统
相关标签/搜索
“url”
url
各个
a+b
a&b
b'+'a
a+++++b
02.url
url&http
2.url
Java
快乐工作
HTTP/TCP
SQLite教程
Redis教程
PHP教程
文件系统
存储
插件
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
正确理解商业智能 BI 的价值所在
2.
解决梯度消失梯度爆炸强力推荐的一个算法-----LSTM(长短时记忆神经网络)
3.
解决梯度消失梯度爆炸强力推荐的一个算法-----GRU(门控循环神经⽹络)
4.
HDU4565
5.
算概率投硬币
6.
密码算法特性
7.
DICOMRT-DiTools:clouddicom源码解析(1)
8.
HDU-6128
9.
计算机网络知识点详解(持续更新...)
10.
hods2896(AC自动机)
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
给定a、b两个文件,各存放50亿个url,每个url各占64字节
2.
面试- 阿里-. 大数据题目- 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
3.
给定a、b两个文件,各存放50亿个url,每一个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
4.
给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
5.
海量数据面试题整理1.给定a、b两个文件,各存放50亿个url,每一个url各占64字节,内存限制是
6.
有10 亿个 url,每一个 url 大小小于 56B,要求去重,内存只给你4G
7.
海量数据实战(0)从两个文件50亿数据中找出相同的URL
8.
jsp url文件判断是否存在
9.
php-获取URL的各个段的值
10.
一个英文字母,一个中文各占多少字节?
>>更多相关文章<<