hdfs配置多块磁盘

hdfs须要存写大量文件,有时磁盘会成为整个集群的性能瓶颈,因此须要优化hdfs存取速度,将数据目录配置多磁盘,既能够提升并发存取的速度,还能够解决一块磁盘空间不够的问题。html

  1. 首先dfs.name.dir和yarn.nodemanager.local-dirs的目录都不大,彻底能够不配多磁盘或者只配置2块磁盘,最主要就是将dfs.data.dir配置成多磁盘。因此只须要修改dfs.data.dir便可:
<property>
    <name>dfs.data.dir</name>    
    <value>/home/bigdata/datac/,/home/bigdata/datac</value>
</property>
  1. 若是配置了多磁盘,还须要配置磁盘存放选择策略,有2中磁盘存放选择策略,默认是第一种,可是第二种可能效率更高更优秀
<property>
    <name>dfs.datanode.fsdataset.volume.choosing.policy</name>
    <value>org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy</value>
 </property>

参考:
hadoop2.0的datanode多目录数据副本存放策略,hadoop2.0datanode
为datanode配置多个数据存储地 node

相关文章
相关标签/搜索