建立hadoop用户同时指定使用 /bin/bash 做为 hadoop的shell:node
useradd -m hadoop -s /bin/bashshell
为hadoop 设置密码。apache
sudo passwd hadoopbash
为 hadoop 用户增长管理员权限,方便部署分布式
sudo adduser hadoop sudooop
下载文件:spa
wget https://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gzcode
解压到/usr/local/目录下orm
sudo tar -zxf hadoop-2.7.7.tar.gz -C /usr/local/xml
Hadoop 能够在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既做为 NameNode 也做为 DataNode,同时,读取的是 HDFS 中的文件。
Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中,伪分布式须要修改2个配置文件 core-site.xml 和 hdfs-site.xml 。Hadoop的配置文件是 xml 格式,每一个配置以声明 property 的 name 和 value 的方式来实现。
修改配置文件 core-site.xml (经过 gedit 编辑会比较方便: gedit ./etc/hadoop/core-site.xml
),将当中的
修改成下面配置:
一样的,修改配置文件 hdfs-site.xml:
Hadoop 的运行方式是由配置文件决定的(运行 Hadoop 时会读取配置文件),所以若是须要从伪分布式模式切换回非分布式模式,须要删除 core-site.xml 中的配置项。
此外,伪分布式虽然只须要配置 fs.defaultFS 和 dfs.replication 就能够运行(官方教程如此),不过若没有配置 hadoop.tmp.dir 参数,则默认使用的临时目录为 /tmp/hadoo-hadoop,而这个目录在重启时有可能被系统清理掉,致使必须从新执行 format 才行。因此咱们进行了设置,同时也指定 dfs.namenode.name.dir 和 dfs.datanode.data.dir,不然在接下来的步骤中可能会出错。