Hadoop7days-4 MR实现倒排索引

实现倒排索引值得是:将位于不同文件里面的单词,统计出其在不同文件中出现的次数,结果应为 “hello”,"a.txt->3,b.txt->2,c.txt->2" 的形式。要达成这一目标,需要设置多个mapper和reducer类。可以使用倒退的方法,来确定各个mapper和reducer要实现的功能,其步骤如下: mapper 的输出是 context.write("hell0->a.txt","
相关文章
相关标签/搜索