HDFS是什么?为何要使用它?

hdfs是hadoop的文件管理系统,主要有两部分:node

一个是NameNode:主要做用是负责接收客户端求,告知datanode的blk存储位置,维护hdfs的目录树;服务器

另外一个是DateNode:主要是把文件分割成blk存储在不一样的服务器上,而且负责产生副本,也能按期向NameNode汇报blk的状况;负载均衡

使用hdfs的好处是提升系统的高可用性:由于hdfs分布式存储,存在多个blk分布在不一样的服务器,同时有多个副本,若是某个服务器宕机,不影响总体性能;分布式

能够实现负载均衡、提升响应效率,由于多个服务器能够同时服务,提升了效率。oop