第6章-MapReduce的工做机制-笔记

时间 2019-11-05

标签 mapreduce 机制笔记栏目 Hadoop 繁體版

原文原文链接

做业的提交

能够只用一行代码来运行一个MapReduce做业：算法

JobClient.runJob(conf)。分布式

一、早期版本的Hadoop使用FIFO调度算法来运行做业oop

早期版本的Hadoop使用一种很是简单的方法来调度用户的做业：spa

按照做业提交的顺序，使用FIFO（先进先出）调度算法来运行做业。队列

二、随后，经过设置mapred.job.priority或JobClient的setJobPriority（）方法来设置优先级hadoop

三、Hadoop的调度器种类ci

在Hadoop中，MapReduce的调度器能够选择。it

1）、默认的调度器是原始的基于队列的FIFO调度器。io

2）、Fair Scheduler 公平调度器map

3）、Capacity Scheduler

JobClient.runJob(conf);

1）、客户端：提交MapReduce做业。

2）、jobtracker：协调做业的运行。

jobtracker是一个Java应用程序，它的主类是JobTracker。

3）、tasktracker：运行做业划分后的任务。

tasktracker是一个Java应用程序，它的主类是TaskTracker。

4）、分布式文件系统（通常为HDFS）

用来在其余实体间共享做业文件。