MapReduce过程详解及其性能优化

http://blog.csdn.net/aijiudu/article/details/72353510java 废话不说直接来一张图以下:node 从JVM的角度看Map和Reduceapache Map阶段包括: 第一读数据:从HDFS读取数据 一、问题:读取数据产生多少个Mapper??     Mapper数据过大的话,会产生大量的小文件,因为Mapper是基于虚拟机的,过多的Mappe
相关文章
相关标签/搜索