spark2学习(2) 之RDD编程

  RDD编程指南 实际上从spark2开始就不推荐使用rdd了,使用dataset操做更加简单高效,可是咱们仍是简单介绍一下内容吧html 弹性分布式数据集(RDD) Spark围绕弹性分布式数据集(RDD)的概念展开,RDD是能够并行操做的容错的容错集合。建立RDD有两种方法:并行化 驱动程序中的现有集合,或引用外部存储系统中的数据集,例如共享文件系统,HDFS,HBase或提供Hadoop
相关文章
相关标签/搜索