4-hadoop的运行模式(本地)

Hadoop的运行模式

Hadoop运行模式包括:本地模式、伪分布式模式以及彻底分布式模式。html

Hadoop官方网站:http://hadoop.apache.org/正则表达式

2.7.2版本官网:http://hadoop.apache.org/docs/r2.7.2/
文档:http://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/SingleCluster.htmlapache

 

Grep案例

在hadoop文件夹下新建input文件夹
进行拷贝配置文件分布式

 

命令:在hadoop文件目录下oop

cp etc/hadoop/*.xml  input/

  

执行测试命令测试

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar  grep input/  output/  'dfs[a-z.]+'

解释:网站

首先使用hadoop命令 找到jar (指定jar的地址) grep为测试的案例spa

其次是指定输入路径  input/   均是一些配置文件   output/ 为输出路径(注意:这个文件夹不须要建立)code

最后使用一个正则表达式进行字符的验证xml

 

注意:output文件不能建立不然会进行报错:该文件夹已经存在

 

执行程序能够发现(部分):

 

此时进入output目录下:

_SUCCESS:表示执行成功

part-r-0000:表示执行以后生成的数据文件

 

此时查询part-r-0000查询匹配的相关正则表达式的内容

 

 

 wordcount案例

 在hadoop目录下建立wcinput文件夹

统计关键词出现的次数

进行新建立的文件夹目录下出啊昂见wc.input文件夹

文件地内容:

 

命令:

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar  wordcount wcinput/ wcoutput/

 

进入wcoutput进行查看

 

相关文章
相关标签/搜索