BigData————RDD编程

1、定义RDD:      1.RDD 是一个分布式的,弹性的数据集,是spark应用中最基本的统一的数据格式单位java      RDD分区就是一段连续的数据片python 不一样的数据源,要统一格式,而这个统一的格式就是RDD。sql spark的计算就是RDD的转换过程。RDD是能够读取的,RDD是不能够修改的,只能对RDD进行转换,转换成新的RDD。编程 每一个spark应用程序都包含一
相关文章
相关标签/搜索