Hadoop的读写操做、元数据及SecondaryNameNode、Checkpoint原理

时间 2020-03-06

标签 hadoop 读写数据 secondarynamenode checkpoint 原理栏目 Hadoop 繁體版

原文原文链接

1、写操做

　　1）客户端经过Distributed FileSystem模块向namenode请求上传文件，namenode检查目标文件是否已存在，父目录是否存在。node

　　2）namenode返回是否能够上传。缓存

　　3）客户端请求第一个 block上传到哪几个datanode服务器上。服务器

　　4）namenode返回3个datanode节点，分别为dn一、dn二、dn3。oop

　　5）客户端经过FSDataOutputStream模块请求dn1上传数据，dn1收到请求会继续调用dn2，而后dn2调用dn3，将这个通讯管道创建完成。设计

　　6）dn一、dn二、dn3逐级应答客户端。3d

　　7）客户端开始往dn1上传第一个block（先从磁盘读取数据放到一个本地内存缓存，而后才会写入本地磁盘），以packet为单位，dn1收到一个packet就会传给dn2，dn2传给dn3；dn1每传一个packet会放入一个应答队列等待应答。日志

　　8）当一个block传输完成以后，客户端再次请求namenode上传第二个block的服务器。（重复执行3-7步）blog

2、读操做

　　　1.请求namenode 由于namenode元数据里面记录了DataNode的地址队列

　　　2.把咱们的信息返回给客户端内存

　　　3.客户端收到信息以后就到相应客户端去请求数据便可

　　　4.重点是请求那个DataNode上的哪一个块信息，由于namenode上存放的是块编号

3、元数据

　　元数据保存在内存中，fsimage是元数据文件的存放方式，fsimage中的内容是各个文件的块信息

　　namenode中fsimage信息会每隔半小时更新一次，新文件与旧文件合并不断更新，在关闭时也会更新一次，开启时namenode会吧fsimage的数据加载到内存

4、namenode和SecondaryNameNode CheckPoint原理

　　在无Secondarynamenode时namenode要处理大量的客户端的请求还要每半小时把内存的数据同步到fsimage一次，为了减少namenode工做负担，设计出secondarynamenode。

　　secondarynamenode是对namenode的一个备份，它会下载namenode上的日志信息，根据日志生成fsimage实现对namenode的备份，把fsimage传给namenode，这时同步的任务交给secondarynamenode，namenode无需本身每半小时同步到fsimage。

　　不开启secondarynamenode的状况下，若是namenode挂掉就没法恢复。

　　1.secondary namenode请求主Namenode中止使用edits文件，暂时将新的写操做记录到一个新文件中，如edits.new。
　　2.secondary namenode节点从主Namenode节点获取fsimage和edits文件（采用HTTP GET）
　　3.secondary namenode将fsimage文件载入到内存，逐一执行edits文件中的操做，建立新的fsimage文件
　　4.secondary namenode将新的fsimage文件发送回主Namenode（使用HTTP POST）
　　5.主Namenode节点将从secondary namenode节点接收的fsimage文件替换旧的fsimage文件，用步骤1产生的edits.new文件替换旧的edits文件（即更名）。同时更新fstime文件来记录检查点执行的时间

　　注：从Hadoop0.21.0开始，辅助Namenode已经放弃不用，由checkpoint节点取而代之，功能不变。新版本同时引入一种新的Namenode，名为BackupNode