1.格式化node
首先格式化以后只剩下一个根目录。日志
格式化后会出现元数据xml
集群启动以后,元数据放在内存中的(消耗内存中)blog
格式化后会产生镜像文件fsimage,元数据存储内存
启动的时候namenode会读取镜像文件,知道整个系统的文件文档
在HDFS上的用户行为操做都会记录在编辑日志文件edits中(重要)it
2.启动集群
在启动的时候,首先读取fsimage,而后去读edits后台
3.secondary namenode监控
会读取fsimage,而后去读edits。
而后将者两个文件的信息加载到内存中
会将信息写到一个新的镜像文件中,接着再生成一个deits文件
下次namenode启动时会读取新的fsimage文件
2017.12.20 经过阅读文档,这里进行补充(注意点是这个fsimage是secondary nameNode的):
4.做用
合并
减小namenode的启动时间
用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照
5.配置hdfs-site.xml
6.启动
7.管理界面
端口号50090