HDFS原理解析

      HDFS提供分布式存储机制,提供可线性增长的海量存储能力。自动的数据冗余,无须使用Raid(磁盘阵列),无须另行备份。为进一步分析计算提供数据基础。 1 HDFS设计基础与目标       (1)超大文件。HDFS能够处理百万规模以上的文件数量( GB、TB、PB级数据),能够处理10K节点的规模。       (2)流式访问数据。一次写入,多次读取。Hadoop擅长做的是数据分析而不
相关文章
相关标签/搜索