建立RDD

建立RDD的两种方式:shell 1. 读取稳定物理存储(eg:HDFS)外部数据集学习 2. 在驱动程序中对一个集合进行并行化(也就是其它已有的RDD上执行肯定性操做,这些肯定性操做称做转换(Transformation))测试  方法一:建立 RDD 最简单的方式就是把程序中一个已有的集合传给 SparkContext 的 parallelize()方法,这种方式在学习 Spark 时很是有用
相关文章
相关标签/搜索