RDD和DataFrame的区别

spark3.0版本可能不太公布底层的RDD,以后使用dataframe将成为趋势,现在大都数公司也多使用dataframe来处理数据 RDD、DataFrame和DataSet是容易产生混淆的概念,必须对其相互之间对比,才可以知道其中异同。 RDD和DF的区别 上图直观地体现了DataFrame和RDD的区别。左侧的RDD[Person]虽然以Person为类型参数,但Spark框架本身不了解P
相关文章
相关标签/搜索