hadoop中的JournalNode

时间 2020-06-13

标签 hadoop journalnode 栏目 Hadoop 繁體版

原文原文链接

JournalNode是在MR2也就是Yarn中新加的,journalNode的做用是存放EditLog的,node

在MR1中editlog是和fsimage存放在一块儿的而后SecondNamenode作按期合并,Yarn在这上面就不用SecondNamanode了.服务器

Active Namenode与StandBy Namenode之间的就是JournalNode,做用至关于NFS共享文件系统.Active Namenode往里写editlog数据,StandBy再从里面读取数据进行同步.spa

配置文件是；hdfs-site.xml文件负责xml

最后进程JPS以下图：blog

两个NameNode为了数据同步，会经过一组称做JournalNodes的独立进程进行相互通讯。当active状态的NameNode的命名空间有任何修改时，会告知大部分的JournalNodes进程。进程

standby状态的NameNode有能力读取JNs中的变动信息，而且一直监控edit log的变化，把变化应用于本身的命名空间。standby能够确保在集群出错时，命名空间状态已经彻底同步了。资源

NameNode服务器：运行NameNode的服务器应该有相同的硬件配置。部署

* JournalNode服务器：运行的JournalNode进程很是轻量，能够部署在其余的服务器上。注意：必须容许至少3个节点。固然能够运行更多，可是必须是奇数个，如三、五、七、9个等等。同步

当运行N个节点时，系统能够容忍至少(N-1)/2(N至少为3)个节点失败而不影响正常运行。 it

在HA集群中，standby状态的NameNode能够完成checkpoint操做，所以不必配置Secondary NameNode、CheckpointNode、BackupNode。若是真的配置了，还会报错。