maprudece的shuffle机制

Maprudece的Shuffle机制 1.shuffle:map的输出作为reduce的输入的中间的过程 2.shuffle的阶段 1)由map()方法将key/vaule写到环形缓冲区当中 2)环形缓冲区默认为100MB,若达到阈值(80%)就会发生溢写,产生临时文件(将80MB的文件溢写,并且不影响向缓冲区写入数据的过程,这个过程是启动了单独的一个线程来做,如果map输出的数据量大,溢写可能
相关文章
相关标签/搜索