Hadoop分布式文件系统-HDFS的一些概念

当数据集的大小超过一台独立的物理计算机的存储能力是,就有必要对它进行分区(partition)并存储到若干台单独的计算机上。管理网络中跨多台计算机存储的文件系统称为分布式文件系统(distributed filesystem)。Hadoop 自带一个HDFS 的分布式文件系统,即 Hadoop Distributed Filesystem。 HDFS 的设计 超大文件 指的是具有几百MB、几百GB
相关文章
相关标签/搜索