如何在Hadoop上跑通WordCount

先整体上说一下整个流程是怎么弄的。 首先我们需要有WordCount.java源程序,输入文档file1.txt,里面写上几行单词。接着对该源文件进行编译,编译之后打包成jar。然后把file1传到hadoop里,接着把file1、jar包扔给hadoop让他来帮我们统计每个单词出现的次数,结果输出在我们指定的路径里的part-r-00000。 下面来看具体是怎么操作的吧! 首先,需要Hadoop
相关文章
相关标签/搜索