思考:若是电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号(1)和绿灯信号(0),可是存储该数据的磁盘坏了,一直显示是绿灯,是否很危险?node
同理,DataNode节点上的数据损坏了,却没有发现,是否也很危险,那么如何解决呢?windows
DataNode进程死亡或者网络故障形成DataNode没法与NameNode通讯时的TimeOut参数设置浏览器
# dfs.namenode.heartbeat.recheck-interval默认为300000ms,dfs.heartbeat.interval默认为5s
TimeOut = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval复制代码
需求:随着公司业务的增加或者重大活动(例如双11),数据量愈来愈大,原有的数据节点的容量已经不能知足存储数据的需求,须要在原有集群基础上动态添加新的数据节点。安全
退役旧数据节点有两种方式:添加白名单和黑名单退役服务器
hadoop安装目录/etc/hadoop
目录下建立dfs.hosts文件 <property>
<name>dfs.hosts</name>
# dfs.hosts文件所在路径
<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts</value>
</property>复制代码
[kocdaniel@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful复制代码
[kocdaniel@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes复制代码
[kocdaniel@hadoop102 sbin]$ ./start-balancer.sh复制代码
hadoop安装目录/etc/hadoop
目录下建立dfs.hosts.exclude文件 <property>
<name>dfs.hosts.exclude</name>
<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude</value>
</property>
复制代码
[kocdaniel@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[kocdaniel@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes复制代码