大数据笔记之MapReduce原理

MapReduce原理 Mapreduce是一种“分而治之”的思想,把大任务拆解为多个小任务 原理流程 框架解剖图 输入数据分块InputSplits:InputSplit定义了输入到单个Map任务的输入数据,一个MapReduce程序被统 称为一个Job,可能有上百个任务构成。InputSplit将文件分为64MB。 RR(RecordReader):称数据记录读入,其作用定义了如何将输入的数据
相关文章
相关标签/搜索