Spark中Task,Partition等关键概念

源自知乎https://www.zhihu.com/question/33270495?sort=created 先盗一个图 输入多个hdfs文件,每个文件有多个block,当spark读取多个文件时,将多个block合并为一个输入分片(InputSplit,它是不能跨文件的),每个输入分片对应一个task,一个task会被分配到某个节点的一个executor上执行,每个executor上有多个c
相关文章
相关标签/搜索