hadoop进阶2_2.x

HDFS是Hadoop分布式文件系统的简称,由若干台计算机组成,用于存放PB、TB数量级以上的文件,每份文件可以有多个副本,所以HDFS是一个具有高冗余、高容错的文件系统。 Hadoop系统架构图 hadoop2.0以后的版本移除了原有的JobTracker和TaskTracker,改由Yarn平台的ResourceManager负责集群中所有资源的统一管理和分配,NodeManager管理Had
相关文章
相关标签/搜索