PySpark初始化,生成RDD

Table of Contents   Spark程序执行过程 Spark程序初始化 RDD 创建RDD 1. parallelize()集合 list或者array 2 textFile Spark程序执行过程 每个spark 应用(application)包含一个驱动(driver)程序,这个驱动程序运行用户的主函数,并在集群中执行并行化操作。 驱动其实就是你的老大,你的主函数,他会产生很多个
相关文章
相关标签/搜索