HDFS: Hadoop Distributed File System架构
特色:hadoop分布式的文件系统,具有高容错、部署方便的特色,master/slave架构分布式
组件:NameNode和DataNodeoop
NameNode:名称节点,记录HDFS文件所在的Block的大小、部署位置等信息,相似文件索引信息的概念,充当master的角色,整个HDFS文件系统只有一个NamNode节点,为了保证Hadoop的高容错的特色,能够设置secondNameNode,对主NameNode进行数据备份,防止NameNode的单点故障形成HDFS文件系统的崩溃性能
DataNode:HDFS文件具体存储数据的信息,相似数据仓库的概念,HDFS集群能够由多个DataNode组成,实现存储容量的动态扩容blog
高容错的保障措施:索引