大数据- MapReduce计算模型

1.分布式文件系统 1.1 数据激增 以前,在数据量比较少的时候是单节点结构,CPU-Memory-Disk;后来,随着互联网的不断发展,数据量激增;以Google为例:Google每天产生的网页数量达到200TB,假设磁盘读取带宽为50MB/sec,则读取这些文件需要46天,后续的数据处理与操作话费的时间可能会更多。 1.2 分布式文件系统 分布式文件系统结构如下: 1. 数据以“块状”形式在多
相关文章
相关标签/搜索