搭建Hadoop伪分布式集群分享

1.快速了解Hadoop 1.1什么是Hadoop? Hadoop是一个提供分布式存储和计算能力的平台,我们简单的将它理解为一个分布式的主从架构,其中包括用于存储的HDFS和用于计算的MapReduce,我们只要知道他主要用于大数据量的分区和大数据集的并行计算。 那么数据量有多大才算是大数据量呢,简单的说达到PB级,也就是2的50次方个字节,或者在数值上大约等于1000个TB。 Hado
相关文章
相关标签/搜索