Spark RDD

1.RDD 概述 1.1 什么是 RDD ? RDD(Resilient Distributed Dataset) 叫着 弹性分布式数据集 ,是Spark 中最基本的抽象,它表明一个不可变、可分区、里面元素能够并行计算的集合。php RDD 具备数据流模型特色:自动容错、位置感知性调度和可伸缩。java RDD 容许用户在执行多个查询时,显示地将工做集缓存在内存中,后续的查询可以重用工做集,这将会
相关文章
相关标签/搜索