如何在Hadoop上跑通WordCount

时间 2021-01-10

原文原文链接

先整体上说一下整个流程是怎么弄的。首先我们需要有WordCount.java源程序，输入文档file1.txt，里面写上几行单词。接着对该源文件进行编译，编译之后打包成jar。然后把file1传到hadoop里，接着把file1、jar包扔给hadoop让他来帮我们统计每个单词出现的次数，结果输出在我们指定的路径里的part-r-00000。下面来看具体是怎么操作的吧！首先，需要Hadoop