MR优化 & hadoop参数调优

MR优化 小文件 所谓小文件,就是单个文件的size小于blockSize。node HDFS 小文件影响 (1)影响 NameNode 的寿命,由于文件元数据存储在 NameNode 的内存中 (2)影响计算引擎的任务数量,由于每一个小的文件都会生成一个 Map 任务web 数据输入小文件处理: (1)合并小文件:对小文件进行归档(Har)、自定义 Inputformat 将小文件存储成Sequ
相关文章
相关标签/搜索