第三章 MapReduce计算模型

      3.1 为什么用MapReduce 分布式+海量数据   3.2 MapReduce计算模型 JobTracker,用户管理和调度工作 TaskTracker,用于执行工作 Job,每个个MapReduce任务被初始化为一个Job,每个Job又分为两个阶段,分别用Map函数和Reduce函数表示这两个阶段 InputSplit,存储的不是数据本身,而是一个分片长度和一个记录数据位置的数
相关文章
相关标签/搜索