见前文apache
这里以2.7.7版本为例,将文件剪切到/usr/local里面并更更名字为hadoop方便后续配置bash
设置
hadoop
目录下的env
文件,hadoop/etc/hadoop-env.sh
文件,注意这里的etc
是在hadoop
目录下的etc
,你们注意命令执行的路径,在里面定义jdk
目录,建议将hadoop_home
和path
也定义一下oop
这里直接设置
~/.bashrc
,设置相关配置便可,HADOOP_HOME
是个人hadoop
文件路径,你们根据我的状况更改便可,最后的PATH
由于我在bashrc里面同时配置了jdk
、hadoop
和hbase
,因此若是有和我状况相同的小伙伴建议将PATH下在一块儿,像注释那样测试
配置
hosts
文件,为主机增长IP映射3d
通常咱们测试的时候都会使用
hadoop
或者hduser一类的用户,当测试的时候切换到对应用户并进行操做,也可使用其余用户(主机用户),可是记得对用户进行受权,不然当后面操做的时候会由于不能访问文件而致使错误。code
进入
hadoop
目录,创建input
文件夹,复制几个文件看成输入数据源(这里采用的是hadoop/etc/*.xml
),而后执行haddop
自带的关键字提取方法进行检验,将结果输出到output
文件当中,__注意:__二次实验时须要事先删除output
文件cdn
执行完毕后目录下会出现output
文件夹,查看里面的文件的内容便可xml