Hadoop渐进六:HDFS

一、简述 Hadoop分布式文件系统通常在通用硬件上运行,它和现有的其他分布式文件系统有很多相同之处,同时也有着明显的区别。HDFS具有高容错、高吞吐量、低廉价部署等特性,非常适合于大规模数据集的管理和存储。HDFS最开始是作为Apache Nutch搜索引擎项目基础框架而开发,它是Apache Hadoop Core项目的一部分。 二、HDFS设计基础 1、硬件故障 硬件故障是一种常态,而不是异
相关文章
相关标签/搜索