Yarn大致框架和工做流程研究

时间 2021-04-27

标签 html apache 安全网络架构框架 ide oop spa 架构设计栏目 Hadoop 繁體版

原文原文链接

1、概述
html

将公司集群升级到Yarn已经有一段时间，本身也对Yarn也研究了一段时间，如今开始记录一下本身在研究Yarn过程当中的一些笔记。这篇blog主要主要从大致上说说Yarn的基本架构以及其各个组件的功能。另外，主要将Yarn和MRv1作详细对比，包括Yarn相对于MRv1的各类改进。最后，大概说说Yarn的工做流状况。
apache

2、Yarn和MRv1对比安全

(1)扩展性对比。网络

在MRv1中，JobTracker是个重量级组件，集中了资源管理分配、做业控制两大核心功能，随着集群规模的增大，JobTracker处理各类RPC请求负载太重，这也是系统的最大瓶颈，严重制约了Hadoop集群的扩展性。相比之下，Yarn将JobTracker功能进行了拆分，拆分为全局组件ResourceManager、应用组件ApplicationMaster和JobHistoryServer。其中，ResourceManager负载整个系统资源的管理和分配，ApplicationMaster负载单个应用程序的相关管理(job的管理),JobHistoryServer负载日志的展现和收集工做。Yarn的这种功能拆分，将减轻了master节点的负载，其处理的RPC请求的压力获得减小。其实换句话Yarn是将这种负载进行了横向转移到子节点，这个能够经过ApplicationMaster(简称APP Mstr)的机制体现，APP Mstr是运行在其中一个子节点，运行在其余各个子节点的Task只须要向App Mstr发送相关的RPC请求来汇报task运行状况就ok，而不须要直接和master节点的相关进行进行RPC通信。这个就将MRv1的Master/slave转化为了Master/slave混杂slave/slave的这种结构。架构

另外，Hadoop1.x扩展性差问题不只仅体如今MRv1框架中，提体如今HDSF中。Yarn为了解决这个问题，提出了HDFS Federation,它能够容许集群中启动多个NameNode来分管不一样目录的元数据进而实现了访问隔离和横向扩展问题，同时HDFS Federation的提出也完全解决了hadoop1.x的NameNode单点故障问题。
框架

(2)资源利用率对比。ide

MRv1的资源管理分配模型是基于槽位的，槽位是一个至关粗粒度的系统资源单位，一个槽位是系统必定cpu、内存、网络、IO等资源的抽象。一个Slot只能启动一个Task，关键的是一个Task未必用完一个Slot所对应的系统资源，可是它又占着不给别的Task使用，这就形成了浪费。另外，在MRv1中Slot还被分为了Reduce Solt和Map Slot，Reudce solt只能启动Reduce Task，Map Slot只能启动Map Task，这两种Slot不容许共享，所以经常会致使一种Slot资源至关紧张而另一种Slot资源倒是空闲的。例如，当一个Job刚刚被提交的时候，只有当Map Task完成数据为总数量的5%（默认）时，Reduce Task才会启动，那么此时的Reudce Slot就是被闲置浪费了。另外，若是想了解更多关于MRv1的资源管理方案的话，请看看我以前写的blog：http://zengzhaozheng.blog.51cto.com/8219051/1362100 。相比之下，Yarn就克服了上面的问题，Yarn的资源抽象单位container是细粒度的，并且是动态的（目前Yarn版本中只支持cpu和内存的动态分配），他能够为不一样的Task需求进行分配，并且container是部分种类的，在MRv框架中能够同时被Map Task和Reduce Task使用。oop

(3)安全稳定性对比。spa

Hadoop1.x对应的HDFS版本中NameNode是存在单点故障的，可是Yarn经过HFDS Federation的提出完美地解决了这个棘手问题。
架构设计

(4)基本架构特性对比。

MRv1是单纯地为离线框架Map Reduce打造的，而这种离线计算机框架不能知足如今需求了，一些更有针对性的框架被开发出来，如Spark、storm、DAG计算机框架Tez。这些新的框架没法运行在MRv1上。相比之下，Yarn是一个独立的资源管理系统，其资源和计算机框架是被分离开来的，你能够在Yarn上同时运行MR APP、Spark APP、MPI APP等等。

3、Yarn基本架构以及各个组件负责功能

Yarn在总体上看仍是采用了和Hadoop1.x同样的Master/Slave结构（横向扩展混杂Slave/Slave结构），在整个Yarn资源管理系统当中，ResourceManager做为Master，各个节点的NodeManager做为Slave。各个节点上NodeManager的资源由ResourceManager统计进行管理和调度。当应用程序提交后，会有一个单独的Application来对该应用程序进行跟踪和管理，同时该Application还会为该应用程序想Resource申请资源，并要求NodeManager启动该应用程序占用必定资源的任务。下图主要以MR和MPI这两种应用来描述Yarn运行的基本架构：

基本组件介绍：

一、ResourceManager

ResourceManager是Yarn的核心组件，主要由任务调度器（YarnScheduler）和应用程序管理器（Applications Manager）组成。其主要功能是负责系统资源的管理和分配。

任务调度器(YarnScheduler)

任务调度器根据系统资源容量以及管理员对队列的限制条件，按照必定的策略将资源分配给正在运行的应用程序。相比于Hadoop1.x而言，Yarn为任务调度器作了减负，任务调度器再也不负责跟踪和监控应用的执行状态，也不负责从新启动由于应用执行失败或者硬件故障而运行失败的任务，这些任务都有该应用程序对应的ApplicationMaster来负责了，这使得YarnScheduler的功能更加纯粹。另外，任务调度器和Hadoop1.x同样也是一个热插拔模块，你能够自定义本身的任务调度器，一样你也能够直接使用其余任务调度器，如，Fair Scheduler或者Capacity Scheduler。

应用程序管理器（Applications Manager）

应用程序管理器，负责管理整个系统中全部应用程序，包括应用程序提交、向任务调度器申请资源启动ApplicationMaster、监控ApplicationMaster运行状态并在失败时从新启动它。

其余

ResourceManager中还包含了其余组件，如ResourceTrackerService用来直接处理心跳，NMLivelinessMonitor用来监控NodeManager，NodesListManager 提供NodeManager的黑白名单等等。

二、ApplicationMaster(AM)

每当用户提交了一个应用程序就会为这个应用程序产生一个对应的ApplicationMaster，而且这个这个单独进程是在其中一个子节点上运行的。它的主要功能：为应用向ResourceManager申请资源、在job对Task实行调度、与NodeManager通讯以启动或者中止任务、监控全部任务的运行状况，而且在任务失败的情下，从新为任务申请资源而且重启任务、负责推测任务的执行、当ApplicationMaster向ResourceManager注册后，ApplicationMaster能够提供客户端查询做业进度信息等。

三、NodeManager(NM)

NM是每一个子节点上的资源和任务管理器，一方面，它会定向经过心跳信息向RM汇报本节点上的资源使用状况和各个Container的运行状况；另外一方面，它会接收而且处理来自AM的Container启动和中止的各类请求。它的能有点像Hadoop1.x中的TaskTracker。

四、Container

Container是Yarn中对系统资源的抽象，同时它也是系统资源分配的基本单位，它封装节点上多维度资源，其中包括CPU、内存、磁盘、网络等。Yarn会为每一个任务分配一个Container，而且该任务只可以使用该Container中所描述的资源。值得关注的的是，Yarn中的Container和MRv1中的Slot是彻底不一样的，Container是一个动态的资源划分单位，它是根据实际提交的应用程序所需求的资源自动生成的，换句话说，Container其里边所描述的CPU、内存等资源是根据实际应用程序需求而变的。而Slot是一个静态的资源抽象单位，每个同类型的Slot所描述的资源信息都是同样的。

4、Yarn工做流

当用户给Yarn提交了一个应用程序后，Yarn的主要工做流程以下图：

步骤1，用户向Yarn提交应用程序，其中包括用户程序、相关文件、启动ApplicationMaster命令、ApplicationMaster程序等。
步骤2，ResourceManager为该应用程序分配第一个Container，而且与Container所在的NodeManager通讯，而且要求该NodeManager在这个Container中启动应用程序对应的ApplicationMaster。
步骤3，ApplicationMaster首先会向ResourceManager注册，这样用户才能够直接经过ResourceManager查看到应用程序的运行状态，而后它为准备为该应用程序的各个任务申请资源，并监控它们的运行状态直到运行结束，即重复后面4~7步骤。
步骤4，ApplicationMaster采用轮询的方式经过RPC协议向ResourceManager申请和领取资源。
步骤5，一旦ApplicationMaster申请到资源后，便会与申请到的Container所对应的NodeManager进行通讯，而且要求它在该Container中启动任务。
步骤6，任务启动。NodeManager为要启动的任务配置好运行环境，包括环境变量、JAR包、二进制程序等，而且将启动命令写在一个脚本里，经过该脚本运行任务。
步骤7，各个任务经过RPC协议向其对应的ApplicationMaster汇报本身的运行状态和进度，以让ApplicationMaster随时掌握各个任务的运行状态，从而能够再任务运行失败时重启任务。
步骤8，应用程序运行完毕后，其对应的ApplicationMaster会向ResourceManager通讯，要求注销和关闭本身。

这个须要注意的是在整个工做流程当中，ResourceManager和NodeManager都是经过心跳保持联系的，NodeManager会经过心跳信息向ResourceManager汇报本身所在节点的资源使用状况。

5、总结

本文主要介绍了Yarn和Hadoop1.x的一些区别，以比较粗粒度的方式介绍了Yarn的基本架构以及其组成的各个组件功能。另外，简单的研究了Yarn的工做流程。下篇blog细粒度分析对ResourceManager的各个功能进行研究。

参考文献：

《hadoop技术内幕：深刻解析YARN架构设计与实现原理》机械工业出版社.董西城
http://hadoop.apache.org/docs/r2.2.0/
http://hadoop.apache.org/docs/r2.2.0/hadoop-yarn/hadoop-yarn-site/YARN.html
http://hadoop.apache.org/docs/r2.2.0/hadoop-yarn/hadoop-yarn-site/WritingYarnApplications.html#Concepts_and_Flow