Hadoop学习(3)——Mapreduce案例分析

一、天气案例:细粒度介绍计算框架 (1)需求:找出每个月气温最高的2天 (2)思路 每年 每个月 最高 2天 1天多条记录? 进一部思考: 年月分组 温度升序 key中要包含时间和温度呀! MR原语:相同的key分到一组,通过GroupCompartor设置分组规则 (3)实现具体思路 自定义数据类型Weather: 包含时间 包含温度 自定义排序比较规则 自定义分组比较: 年月相同被视为相同的k
相关文章
相关标签/搜索