MapReduce中InputFormat和InputSplit解读

MapReduce中InputFormat和InputSplit解读数组          Hadoop的Mapreduce是一个分布并行处理大数据的程序框架,一个Map/Reduce做业(job)一般会把指定要处理(在job的配置中由咱们来指定)数据集切分为若干独立的数据块(这个工做由mapreduce计算框架自动去完成),而后再由 map任务(task)以彻底并行的方式处理它们。app    
相关文章
相关标签/搜索