Hadoop学习笔记一:HDFS

一、HDFS是什么? HDFS是Hadoop Distributed File System的简称;源自于Google的GFS论文,是其开源实现。 基于流数据模式访问和处理超大文件的需求而开发的; 适合应用于大规模数据集上; 二、HDFS优缺点 优点: 处理超大文件,能用来存储管理Pb级数据。 流式数据访问数据。 运行于廉价的集群上 缺点 不适合处理低延迟数据访问 无法高效存储大量的小文件 不支持
相关文章
相关标签/搜索