Spark中Task,Partition,RDD、节点数、Executor数、core数目的关系

Spark中Task,Partition,RDD、节点数、Executor数、core数目的关系 梳理一下Spark中关于并发度涉及的几个概念File,Block,Split,Task,Partition,RDD以及节点数、Executor数、core数目的关系。 【默认情况下split与block是一对一的,而split又与RDD中的partition对应】 输入可能以多个文件的形式存储在HDF
相关文章
相关标签/搜索