7-MapReduce入门

    MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算   通俗的说就是将一个大任务分成多个小任务并行完成,然后合并小任务的结果,得到最终结果。 1)打包注意:  一定要选择一个MAIN,不然不会运行。   2)             3)输出目录是HADOOP自己创建的。如果有这个目录,一定要删除。如下: 4)测试命令:   java -jar WordCount.
相关文章
相关标签/搜索