DataLake in Hortonworks

在Data Lake中,Hortonworks充分扩展了YARN作为数据处理系统的能力,将应用打包,然后根据需要启动程序。工作核心从平台管理转移到业务能力上,如下图所示 在2.x中,YARN是Hadoop的核心资源管理平台,核心概念是Application,Containers及Resources等。Container是虚拟执行环境,由一系列的进程和任务组成,应用程序由Container集合来执行
相关文章
相关标签/搜索