mapreduce之mapjoin

mapjoin指的是在mapreduce的map阶段先加载一个文件缓存到内存当中,这个文件多是从磁盘读取的或网络请求的均可以。java map(key,value,context)方法中读取的数据key和value,这两个数据和先前缓存到内存中的数据一块儿作处理后再context.write()到reduce阶段。web mapjoin至关于在map阶段写数据到reduce阶段前对数据作了处理。a
相关文章
相关标签/搜索