RDD之collect方法执行的过程

首先来看一张图: spark集群中有master节点和Worker节点,master节点负责任务调度,worker节点负责计算。web 当集群启动时,worker节点会向master注册,而且按期向master发送心跳。数据库 当咱们向集群提交任务时,会启动一个进程spark-submit,这个进程也叫作driver。这个进程先要链接master,而后master会经过注册信息找到合适的worke
相关文章
相关标签/搜索