Hadoop之HDFS(一)

HDFS :Hadoop Distribute File System 的简称,Hadoop的一个分布式文件系统 一,HDFS的主要设计理念 1,存储超大文件:GB-TB-PB及文件 2, 一次写入,多次读取(流式数据访问): HDFS存储的数据集作为hadoop的分析对象。在数据集生成后,长时间在此数据集上进行各种分析。每次分析都将设计该数据集的大部分数据甚至全部数据,因此读取整个数据集的时间延
相关文章
相关标签/搜索