一个单词统计的实例,怎样通过MapReduce完成排序?

假设有一批海量的数据,每个数据都是由26个字母组成的字符串,原始的数据集合是完全无序的,怎样通过MapReduce完成排序工作,使其有序(字典序)呢? 对原始的数据进行分割(Split),得到N个不同的数据分块: 实例分析:WordCount 这个类实现Mapper接口中的map 方法,输入参数中的value 是文本文件中的一行,利用StringTokenizer将这个字符串拆成单词,然后将输出结
相关文章
相关标签/搜索