学习的一个MapReduce程序(《beginner`s guide》中的例子)

第一个MR程序是实现关系型数据库中经常都会遇到的表连接操作,也就是join。这里是连接sales和accounts表,通过共同的ID列进行连接。同时统计出总的购买件数以及总的消费额。 下面是两个示例数据,一个是sales.txt,另一个是accounts.txt。 首先是sales.txt: 001 35.99 2012-03-15 002 12.49 2004-07-02
相关文章
相关标签/搜索