CentOS6安装各类大数据软件 第一章:各个软件版本介绍html
CentOS6安装各类大数据软件 第二章:Linux各个软件启动命令java
CentOS6安装各类大数据软件 第三章:Linux基础软件的安装node
CentOS6安装各类大数据软件 第四章:Hadoop分布式集群配置web
CentOS6安装各类大数据软件 第五章:Kafka集群的配置apache
CentOS6安装各类大数据软件 第六章:HBase分布式集群的配置vim
CentOS6安装各类大数据软件 第七章:Flume安装与配置服务器
CentOS6安装各类大数据软件 第八章:Hive安装和配置app
CentOS6安装各类大数据软件 第九章:Hue大数据可视化工具安装和配置框架
CentOS6安装各类大数据软件 第十章:Spark集群安装和部署ssh
基于apache原始厂商:https://archive.apache.org/dist/
基于Cloudera厂商的cdh本:http://archiveprimary.cloudera.com/cdh5/cdh/5/,
Cloudera有免费版和企业版,企业版只有试用期,不过cdh大部分功能都是免费的,使用解压命令将hadoop解压的目标文件夹。
安装HDFS须要修改4个配置文件:hadoop-env.sh,core-site.xml,hdfs-site.xml和slaves
# The java implementation to use.
export JAVA_HOME=/opt/modules/jdk1.8.0_144
<property> <name>fs.defaultFS</name> <value>hdfs://spark-node04.ouyang.com:9000</value> </property>
<property> <name>dfs.replication</name> <value>3</value> </property>
node01.ouyang.com
node02.ouyang.com
node03.ouyang.com
scp –r /export/servers/hadoop-2.7.4/ root@node01.ouyang.com:$PWD
首次使用配置安装号HDFS系统以后,须要进行格式化,在Hadoop的namenode服务器的机器的顶级目录执行以下命令: ./bin/hdfs namenode –format
咱们如今将一个节点上的HDFS文件系统配置完成和格式化完成了,接下来,咱们启动HDFS文件系统
#启动namenode
./sbin/hadoop-daemon.sh start namenode
#启动datanode
./sbin/hadoop-daemon.sh start datanode
#启动以后能够在50070的web界面进行查看
# some Java parameters
export JAVA_HOME=/opt/modules/jdk1.8.0_144
步骤一:修改mapred-site.xml.template为mapred-site.xml 步骤二:在mapred-site.xml中配置资源调度框架是yarn <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> 步骤三:在mapred-site.xml中配置配置日志的UI界面(能够不配) <property> <name>mapreduce.jobhistory.address</name> <value>node01.ouyang.com:10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>node01.ouyang.com:19888</value> </property>
#必配 <!--设置资源调度的名称--> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> #选配 <!--设置resourcemanager的主机名称--> <property> <name>yarn.resourcemanager.hostname</name> <value>spark-node04.ouyang.com</value> </property> <!--配置日志汇集--> <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <property> <name>yarn.log-aggregation.retain-seconds</name> <value>10000</value> </property> <!--配置resourcemanager的内存大小,保证不至于内存过小致使nodeManager挂掉--> <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>8192</value> </property> <!--表示的是可使用的虚拟cpu个数--> <property> <name>yarn.nodemanager.resource.cpu-vcores</name> <value>4</value> </property>
scp -r hadoop/ node03.ouyang.com:$PWD
#启动resourcemanager
./sbin/yarn-daemon.sh start resourcemanager
#启动nodemanager
./sbin/yarn-daemon.sh start nodemanager
#启动以后能够在8088的web界面进行查看
vim /etc/profile
export HADOOP_HOME=/export/server/hadoop-2.7.4
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source /etc/profile
<property> <name>dfs.permissions.enabled</name> <value>true</value> </property>
<!--配置静态用户--> <property> <name>hadoop.http.staticuser.user</name> <value>root</value> </property> <!--修改存储目录--> <property> <name>hadoop.tmp.dir</name> <value>/opt/modules/hadoop-2.7.4/data/tmp</value> </property>
scp -r hadoop-2.7.4/ spark-node05.ouyang.com:$PWD
scp -r hadoop-2.7.4/ spark-node06.ouyang.com:$PWD
在hadoop的sbin目录下执行以下目录:
./stop-all.sh
因为咱们修改了namenode的目录,所以,咱们须要从新格式化namenode:
bin/hdfs namenode –format
一键启动hadoop的hdfs和yarn服务:
./start-all.sh
#建立目录
bin/hdfs dfs -mkdir -p /user/root/data/
#上传文件
bin/hdfs dfs -put /opt/datas/words.txt /user/root/data/
cd /export/server/hadoop-2.7.4/share/hadoop/mapreduce
hadoop jar hadoop-mapreduce-examples-2.7.4.jar pi 20 50
#一键启动脚本 echo "Hadoop开始启动" ssh 192.168.12.121 "source /etc/profile;nohup sh ${HADOOP_HOME}/sbin/start-all.sh >/dev/null 2>&1 &" echo "Hadoop启动完成" echo "Hadoop日志记录开始启动" ssh 192.168.12.121 "source /etc/profile;nohup sh ${HADOOP_HOME}/sbin/mr-jobhistory-daemon.sh start historyserver >/dev/null 2>&1 &" echo "Hadoop日志记录启动完成" #一键中止脚本 echo "Hadoop开始中止" ssh 192.168.12.121 "source /etc/profile;nohup sh ${HADOOP_HOME}/sbin/stop-all.sh >/dev/null 2>&1 &" echo "Hadoop中止完成" echo "Hadoop日志记录开始中止" ssh 192.168.12.121 "source /etc/profile;nohup sh ${HADOOP_HOME}/sbin/mr-jobhistory-daemon.sh stop historyserver >/dev/null 2>&1 &" echo "Hadoop日志记录中止完成"