HDFS和MapReduce核心思想

Hadoop是Apache下的一个开源分布式计算平台,以HDFS(Hadoop Distributed Filesystem)和MapReduce为其核心。为什么会出现这么个东西呢,“需求是最强大的驱动力”,在这个"big data"的时代,比如Facebook每天处理的新数据良就达到20TB,要处理海量数据就不能局限于传统数据库时代的做法了,我们可以把处理数据的任务分散到各节点(普通硬件设备),
相关文章
相关标签/搜索