1、简要描述如何安装配置一个开源hadoop,只描述便可,列出完整步骤。node
答:①建立一个用户和用户组,用来管理hadoop项目;vim
②修改肯定IP地址:vim /etc/sysconfig/network-scripts/ifcfg-eth0;
bash
③修改主机名:vim /etc/sysconfig/networkssh
④修改host主机名和IP地址映射:vim /etc/hostsoop
⑤查看和关闭防火墙:service iptables status 关闭防火墙: service iptables stopspa
⑥安装ssh并配置免密码登陆:ssh-keygen -t rsa 执行完这个命令后,会自动生成两个文件id_rsa(私钥)、id_rsa.pub(公钥),将公钥拷贝到要免登录的机器上:cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
orm
⑦上传并安装jdk,修改~/.bashrc文件,配置Java环境变量xml
⑧安装hadoop:tar -zxvf hadoop....tar.gz进程
⑨配置conf文件:ip
对于hadoop1.* 版本(hadoop-env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml)
对于hadoop2.* 版本(hadoop-env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml,salves文件)
⑩安装配置zookeeper集群
⑪格式namenode,对于hadoop1.*版本:hadoop namenode -format;对于hadoop2.* 版本:hdfs namenode -format
2、正常工做的hadoop集群中hadoop都分别须要启动哪些进程,它们的做用分别是什么?
hadoop2.*版本:会启动NameNode、DFSZKFailoverController,ResourceManager,DataNode、NodeManager、JournalNode