DataFrame与RDD的区别

结合上图进行理解: RDD与DataFrame都是分布式的 可以并行处理的 一个集合 但是DataFrame更像是一个二维表格,在这个二维表格里面,我们是知道每一列的名称 第一列是Name,它的类型是String 第二列是Age,它的类型是Int 第三列是Height,它的类型是Double 而对于DataFrame来说,它不仅可以知道里面的数据,而且它还可以知道里面的schema信息 因此能做的
相关文章
相关标签/搜索