3 Hadoop分布式文件系统

文章目录 3.1 HDFS的设计 3.2HDFS的概念 3.2.1数据块 当数据集的大小超过一台计算机的存储能力时,就有必要对它进行分 区并存储到若干台单独的计算机上。 管理网络中跨多台计算机存储的文件系统称为分布式文件系统。 该系统架构于网络之上,势必会引入网络编程的复杂性,因此分布式文件系统比普通磁盘文件系统更为复杂。 例如,使文件系统能够容忍节点故障且不丢失任何数据,就是一个极大的挑战。  
相关文章
相关标签/搜索