dateSet 、rdd 和dateframe 区别

三种数据结构出现的版本顺序 RDD (Spark1.0) --> Dataframe(Spark1.3) --> Dataset(Spark1.6) RDD  rdd的五大特性 这个用了很多,但是当突然被问到五大特性时,竟然一时卡壳,只记得弹性可分区和容错 ,而血统、依赖和数据本地化并没有归并到特性中,重新查看资料后,发现自己错在把rdd当成一种数据集合,   可分区列表:可以创建指定分区数目,可
相关文章
相关标签/搜索