hadoop分布式文件系统HDFS初识

HDFS是可扩展、容错、高性能的分布式文件系统,异步复制,一次写入多次读取,专门存储超大数据文件,为整个hadoop生态圈提供了基础的存储服务 1.认识HDFS HDFS可在许多服务器上运行,根据需要HDFS可轻松扩展到数千个节点和PB量级的数据。HDFS设置容量越大,某些磁盘(每个磁盘都有默认的数据块大小,这是磁盘在对数据进行读和写时要求的最小单位)、服务器或网络交换机出故障的概率越高(可通过在
相关文章
相关标签/搜索