第一课:理解Spark 的三代API

Spark第一代API:RDD RDD: 五大核心特征: *  - A list of partitions  *  - A function for computing each split  *  - A list of dependencies on other RDDs  *  - Optionally, a Partitioner for key-value RDDs (e.g. to
相关文章
相关标签/搜索