[Spark RDD转换操做运算子]

Spark RDD转换操做 RDD,即弹性分布式数据集,全称为Resilient Distributed Dataset,是一个容错的,并行的数据结构,可让用户显式地 将数据存储到磁盘和内存中,并能控制数据的分区。同时,RDD还提供了一组很是丰富的操做来操做这些数据,如:map,flatMap,filter等转换操做,以及SaveAsTextFile,conutByKey等行动操做。 本博客中将详
相关文章
相关标签/搜索