hdfs须要存写大量文件,有时磁盘会成为整个集群的性能瓶颈,因此须要优化hdfs存取速度,将数据目录配置多磁盘,既能够提升并发存取的速度,还能够解决一块磁盘空间不够的问题。html
<property> <name>dfs.data.dir</name> <value>/home/bigdata/datac/,/home/bigdata/datac</value> </property>
<property> <name>dfs.datanode.fsdataset.volume.choosing.policy</name> <value>org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy</value> </property>
参考:
hadoop2.0的datanode多目录数据副本存放策略,hadoop2.0datanode
为datanode配置多个数据存储地 node