模块一:Hadoop核心框架(四)----Apache Hadoop的重要组成部分

Hadopp=HDFS+MapReduce+Yarn+Common 1.Hadoop HDFS: 一个高可用、高吞吐量的分布式文件系统。 数据切割、制作副本、分散存储 图中涉及到几个角色 NameNode(nn):存储文件的原数据,比如文件名、文件目录结构、文件属性(生产时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。 SecondaryNameNode(2nn):辅助
相关文章
相关标签/搜索