hadoop要点

(1)hadoop小文件影响效率原因: 小文件是指文件size小于HDFS上block大小的文件。这样的文件会给hadoop的扩展性和性能带来严重问题。首先,在HDFS中,任何block, 文件或者目录在内存中均以对象的形式存储,每个对象约占150byte,如果有1000 0000个小文件,每个文件占用一个block,则namenode 大约需要2G空间。如果存储1亿个文件,则namenode需要
相关文章
相关标签/搜索