hive优化:让一个MR作更多的事情

经常会有相似这样的需求: 数据是这样的 user_id  int      用户ID         pay_channel int   充值渠道ID pay_cents   int   充值金额 user_id+pay_channel为惟一键 求每一个用户充值金额最多的渠道。 直观上有两种思路: 1. 先求每一个用户在全部渠道上的最大充值,而后回表join select t1.user_id ,
相关文章
相关标签/搜索