hadoop学习笔记(四)MapReduce常见实例一:去重、求平均值

去重  问题:有一个名为buyer_favorite1的数据文件,记录了用户收藏的商品以及收藏的日期 文件中包含(用户id,商品id,收藏日期)三个字段,数据内容以“\t”分割 要求根据商品id进行去重,统计用户收藏商品中都有哪些商品被收藏,输出去重后所有的商品id和收藏了该商品的用户id 。 数据内容如下: 用户id 商品id 收藏日期 10181 1000481 2010-0
相关文章
相关标签/搜索