Internet Archive 的海量存储浅析

Internet Archive(IA) 这个站点大家应该都不陌生。IA 旨在建立所有互联网站点的”档案库”,如果说 Google 是互联网的数据库的话,那么 IA 就是互联网的数据仓库了,定期对每个 Web 页面保存快照,数据量之大可想而知。 先看看 IA 每天需要面对的处理能力: 存储超过 850 亿个 Web 页面; 每天大约 600 万次的下载; Wayback Machine 收到大约
相关文章
相关标签/搜索