hadoop2.6 配置及优化思路

时间 2019-11-06

标签 hadoop2.6 hadoop 配置优化思路栏目 Hadoop 繁體版

原文原文链接

1.vi /opt/hadoop-2.6.0/etc/hadoop/hadoop-env.sh 缓存

export JAVA_HOME=/opt/jdk1.7.0_75网络

2.vi /opt/hadoop-2.6.0/etc/hadoop/core-site.xml oop

<property>
<name>fs.default.name</name>
<value>hdfs://spore:9000</value>
</property>测试

注：spore为机器的hostname优化

<property>
<name>hadoop.native.lib</name>
<value>true</value>
</property>spa

操作系统

<property>
<name>dfs.permissions</name>
<value>false</value>
</property>xml

排序

<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-2.6.0/tmp</value>
</property>内存

3.vi /opt/hadoop-2.6.0/etc/hadoop/hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>1</value>
</property>

4.vi /opt/hadoop-2.6.0/etc/hadoop/mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

5.vi /opt/hadoop-2.6.0/etc/hadoop/slaves

添加slave的hostname

优化：

尽可能使用combiner减小键值对数目，本地合并键值对，减小网络传输，优化效果明显

调大mapreduce中间结果缓存的内存

巧用复合键让系统完成排序，没必要要本身实现排序