hdfs是hadoop的文件管理系统,主要有两部分:node
一个是NameNode:主要做用是负责接收客户端求,告知datanode的blk存储位置,维护hdfs的目录树;服务器
另外一个是DateNode:主要是把文件分割成blk存储在不一样的服务器上,而且负责产生副本,也能按期向NameNode汇报blk的状况;负载均衡
使用hdfs的好处是提升系统的高可用性:由于hdfs分布式存储,存在多个blk分布在不一样的服务器,同时有多个副本,若是某个服务器宕机,不影响总体性能;分布式
能够实现负载均衡、提升响应效率,由于多个服务器能够同时服务,提升了效率。oop