MapReduce 工作原理解析

MapReduce 工作原理图                原理图流程分析:user program链接了MapReduce库,实现了最基本的Map函数和Reduce函数。图中执行的顺序都用数字标记了。 MapReduce库把输入文件进行分片(分成M份,M为用户定义),每一份通常有16MB到64MB,然后使用fork将用户进程拷贝到集群内其它机器上。 master是任务调度者,为空闲worker
相关文章
相关标签/搜索