研磨Hadoop之HDFS初探

一、HDFS概述 1、HDFS的概念 HDFS是一个分布式文件系统,通过目录树来定位文件。HDFS的设计适合一次写入,多次读取的场景,且不支持文件的修改。 2、HDFS优缺点 (1)优点 1)高容错性 数据自动保存多个副本,通过增加副本提高容错性。 某一个副本丢失,可以自动恢复 2)适合大数据处理 数据规模:可以处理GB、TB、甚至PB的数据 文件规模:处理百万以上的文件数量 3)流式数据访问 一
相关文章
相关标签/搜索