hadoop2.6 配置及优化思路

1.vi /opt/hadoop-2.6.0/etc/hadoop/hadoop-env.sh 缓存

 export JAVA_HOME=/opt/jdk1.7.0_75网络

 

2.vi /opt/hadoop-2.6.0/etc/hadoop/core-site.xml oop

 <property>
 <name>fs.default.name</name>
 <value>hdfs://spore:9000</value>
 </property>测试

注:spore为机器的hostname优化

 

 <!--是否使用本地库,注意hadoop的位数与操做系统的位数是否匹配-->
 <property>
 <name>hadoop.native.lib</name>
 <value>true</value>
 </property>spa

 

 <!--关闭hdfs用户组权限,测试环境下建议打开,方便不一样用户访问-->操作系统

<property>
<name>dfs.permissions</name>
<value>false</value>
</property>xml

 

 <!--hadoop数据存放点,默认/tmp,会重启丢数据,最好配一个-->排序

<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-2.6.0/tmp</value>
</property>内存

 

3.vi /opt/hadoop-2.6.0/etc/hadoop/hdfs-site.xml

 <!--数据备份数,生产环境最好配置3以上-->
 <property>
 <name>dfs.replication</name>
 <value>1</value>
 </property>

 

4.vi /opt/hadoop-2.6.0/etc/hadoop/mapred-site.xml

<!--使用yarn进行资源管理-->

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>


5.vi /opt/hadoop-2.6.0/etc/hadoop/slaves

添加slave的hostname


优化:

尽可能使用combiner减小键值对数目,本地合并键值对,减小网络传输,优化效果明显

调大mapreduce中间结果缓存的内存

巧用复合键让系统完成排序,没必要要本身实现排序

相关文章
相关标签/搜索