Spark之Mapper端和Reduce端调优

Spark在shuffle分为两部分,Mapper端和Reduce端 一、Mapper端调优 假设Mapper端有3个Task,task1,task2,task3,Reducer有两个Task,task1,task2 数据传输到Reducer端的时候首先进行Mapper端的处理,Mapper端的处理很简单,Mapper端有一个Cache写入文件,Mapper端的缓冲层根据Reducer端的需要,将
相关文章
相关标签/搜索