大数据挖掘分析与应用(二)初始hadoop

二 初识Hadoop Hadoop概述 开源的 Hadoop可以搭建大型数据仓库,PB级数据的存储,处理,分析,统计等业务 分布式集群:多台计算机构成 主节点就是管理从节点位置的计算机(图书管理员) 心跳机制: Hadoop三大核心组件: HDFS(分布式文件系统) YARN(资源调度系统)MapReduce(分布式计算框架) HDFS可以将数据多副本存储,这样的好处1.如果一台机器上的一个副本坏
相关文章
相关标签/搜索