二、Hadoop权威指南学习(HDFS)

Hadoop distributed filesystem:以流式数据访问模式来存储超大文件。一次写入、多次读取。 流式数据访问  每次读取都将涉及到数据集的大部分数据甚至全部。(为了读取很大的文件) 商用硬件 低时间延迟  不适合在HDFS上运行,HDFS是为搞数据吞吐量应用优化的,这可能会以提高实践延迟为代价。HBase更适合低延迟访问需求。 大量小文件 无法高效的存储大量小文件 多用户写入,
相关文章
相关标签/搜索