大数据(Hadoop)-HDFS原理

HDFS源自于Google在2003年10月发表的GFS论文,它是一个分布式文件系统,具有高容错,易扩展,存储量大,能够运行在廉价机上等特点,已经被很多企业广泛引用于基础等存储服务。 组件 HDFS中等核心组件主要有两个,一个是NameNode,一个是DataNode。 NmeNode负责管理集群等元数据信息,以及数据分布,DataNode负责存储具体等数据。HDFS存储数据的基本单位是数据块bl
相关文章
相关标签/搜索