Linux系统中CentOS 7集成Hadoop伪分布式环境运行WordCount实例

阿里云上的伪分布式开发环境搭建完成后,来执行一下自带的例子,也就是单词统计实例(WordCount

1、创建输入目录

hadoop fs -mkdirinput

2、在输入目录中放入文件

hadoop fs -put/usr/test/abc.txt  input  把本地/usr/test目录里的abc.txt文件copyhdfs分布式文件系统的 /user/root/input(当前是root登录) 目录里面,因为当前目录就是root 所以 直接写input 就代表/user/root/input


在浏览器中输入ip+端口(x.x.x.x50070)进入网页,在Utilities-——>Browse the file system-——>user-——>root-——>abc.txt

3、执行单词统计指令


 执行完毕之后,执行hadoop fs -ls output,会发现如下


用命令 hadoop fs -cat output/part-r-00000 查看这个part-r-00000文件的内容,会看到执行的结果,也可以刷新浏览器,在root目录下output中查看,找到part-r-00000文件,将它下载下来打开查看。