hadoop中的JournalNode

 

1.在HADOOP扮演的角色

JournalNode是在MR2也就是Yarn中新加的,journalNode的做用是存放EditLog的,node

在MR1中editlog是和fsimage存放在一块儿的而后SecondNamenode作按期合并,Yarn在这上面就不用SecondNamanode了.服务器

 

 Active Namenode与StandBy Namenode之间的就是JournalNode,做用至关于NFS共享文件系统.Active Namenode往里写editlog数据,StandBy再从里面读取数据进行同步.spa

配置文件是;hdfs-site.xml文件负责xml

 

 最后进程JPS以下图:blog

 

2.做用

两个NameNode为了数据同步,会经过一组称做JournalNodes的独立进程进行相互通讯。当active状态的NameNode的命名空间有任何修改时,会告知大部分的JournalNodes进程。进程

standby状态的NameNode有能力读取JNs中的变动信息,而且一直监控edit log的变化,把变化应用于本身的命名空间。standby能够确保在集群出错时,命名空间状态已经彻底同步了。资源

 

 

3.资源配置

NameNode服务器:运行NameNode的服务器应该有相同的硬件配置。部署

* JournalNode服务器:运行的JournalNode进程很是轻量,能够部署在其余的服务器上。注意:必须容许至少3个节点。固然能够运行更多,可是必须是奇数个,如三、五、七、9个等等。同步

当运行N个节点时,系统能够容忍至少(N-1)/2(N至少为3)个节点失败而不影响正常运行。 it

在HA集群中,standby状态的NameNode能够完成checkpoint操做,所以不必配置Secondary NameNode、CheckpointNode、BackupNode。若是真的配置了,还会报错。

相关文章
相关标签/搜索