大数据处理架构Hadoop(大数据技术原理与应用--上课笔记一)

Hadoop的核心组件是HDFS和MapReduce HDFS解决了海量数据的分布式存储 MapReduce解决了海量数据的分布式处理 YARN 做资源调度管理 HDFS:NN Federation 、HA(NN-name node Federation 做数据目录服务,可设置多个name node 进行分区管理;HA:高可容性,热备份) pig:轻量级脚本语言,简化了MapReduce的操作 s
相关文章
相关标签/搜索