hadoop之mapReduce

概述 mapReduce是hadoop中的分布式计算框架 TaskTracker就是NodeManager JobTacker就是ResourceManager . . 序列化 要求数据能被序列化,默认采用avro,mapreduce对avro做了封装,有writable接口 . . 分区 不设置默认一个分区,编号从0开始 分区数决定reduce的数量 . . 排序 继承Comparable接口或
相关文章
相关标签/搜索