大数据-HDFS(Hadoop Distributed File System)

Hadoop是一种分布式系统基础架构。它的目的是从单一的服务器到上千台机器的扩展,每一个台机都可以提供本地计算和存储。 Hadoop主要包括HDFS,YARN,MapReduce三个核心组件: HDFS:负责海量数据的存储 MapRduce:负责海量苏剧的运算 YARN:负责资源调度 HDFS是一个分布式文件系统,主要过程如下: 可见,主要分为四个部分: 1,client HDFS是一个主从关系的
相关文章
相关标签/搜索