DataFrame/RDD/DataSet的异同

自Spark1.4加入DataFrame,1.6加入dataSet以来,RDD的主导地位不断降低,在Spark2.0.0版本以后,社区已经开始建议开发者慢慢放弃使用RDDl了,在版本的升级过程当中,不一样的组件对于DataSet的支持逐渐增强,目前的稳定版本能够说是DataSet已经彻底取代了RDD的做用,那么这三者之间有什么区别和类似之处呢?sql 1、共性 一、RDD、DataFrame、Da
相关文章
相关标签/搜索