在YARN中,ResourceManager负责集群中全部资源的统一管理和分配,它接收来自各个节点(NodeManager)的资源汇报信息,并把这些信息按照必定的策略分配给各个应用程序(其实是ApplicationManager)。apache
ResourceManager主要由如下几个部分组成:安全
YARN分别针对普通用户,管理员和Web提供了三种对外服务,分别对应ClientRMService、AdminService和WebApp:框架
ClientRMServiceoop
ClientRMService是为普通用户提供的服务,它会处理来自客户端各类RPC请求,好比提交应用程序、终止应用程序,获取应用程序运行状态等。spa
AdminServicecode
YARN为管理员提供了一套独立的服务接口,以防止大量的普通用户请求使管理员发送的管理命令饿死,管理员可经过这些接口管理集群,好比动态更新节点列表,更新ACL列表,更新队列信息等。orm
WebAppblog
为了更加友好地展现集群资源使用状况和应用程序运行状态等信息,YARN对外提供了一个Web 界面,这一部分是YARN仿照haml(http://haml.info/)开发的一个轻量级嵌入式Web框架。具体讨论见:https://issues.apache.org/jira/browse/MAPREDUCE-2399接口
NMLivelinessMonitor队列
监控NM是否活着,若是一个NodeManager在必定时间(默认为10min)内未汇报心跳信息,则认为它死掉了,会将其从集群中移除。
NodesListManager
维护正常节点和异常节点列表,管理exlude(相似于黑名单)和inlude(相似于白名单)节点列表,这两个列表均是在配置文件中设置的,能够动态加载。
ResourceTrackerService
处理来自NodeManager的请求,主要包括两种请求:注册和心跳,其中,注册是NodeManager启动时发生的行为,请求包中包含节点ID,可用的资源上限等信息,而心跳是周期性 行为,包含各个Container运行状态,运行的Application列表、节点健康情况(可经过一个脚本设置),而ResourceTrackerService则为NM返回待释放的Container列表、Application列表等。
AMLivelinessMonitor
监控AM是否活着,若是一个ApplicationMaster在必定时间(默认为10min)内未汇报心跳信息,则认为它死掉了,它上面全部正在运行的Container将被认为死亡,AM自己会被从新分配到另一个节点上(用户可指定每一个ApplicationMaster的尝试次数,默认是1次)执行。
ApplicationMasterLauncher
与NodeManager通讯,要求它为某个应用程序启动ApplicationMaster。
ApplicationMasterService
处理来自ApplicationMaster的请求,主要包括两种请求:注册和心跳,其中,注册是ApplicationMaster启动时发生的行为,包括请求包中包含所在节点,RPC端口号和tracking URL等信息,而心跳是周期性 行为,包含请求资源的类型描述、待释放的Container列表等,而AMS则为之返回新分配的Container、失败的Container等信息。
ApplicationACLsManager
管理应用程序访问权限,包含两部分权限:查看和修改,查看主要指查看应用程序基本信息,而修改则主要是修改应用程序优先级、杀死应用程序等。
RMAppManager
管理应用程序的启动和关闭。
ContainerAllocationExpirer
YARN不容许AM得到Container后长时间不对其使用,由于这会下降整个集群的利用率。当AM收到RM新分配的一个Container后,必须在必定的时间(默认为10min)内在对应的NM上启动该Container, 不然,RM会回收该Container。
ResourceManage自带了很是全面的权限管理机制,主要由ClientToAMSecretManager、ContainerTokenSecretManager、ApplicationTokenSecretManager等模块完成。
ResourceScheduler
ResourceScheduler是资源调度器,它按照必定的约束条件(好比队列容量限制等)将集群中的资源分配给各个应用程序,当前主要考虑内存资源,在3.0版本中将会考虑CPU(https://issues.apache.org/jira/browse/YARN-2)。ResourceScheduler是一个插拔式模块,默认是FIFO实现,YARN还提供了Fair Scheduler和Capacity Scheduler两个多租户调度器。
参考资料:
http://hortonworks.com/blog/apache-hadoop-yarn-resourcemanager/
原创文章,转载请注明: 转载自董的博客
本文连接地址: http://dongxicheng.org/mapreduce-nextgen/yarnmrv2-resource-manager-infrastructure/