基于Spark实现电影点评系统用户行为分析—DataFrame篇(二)

文章目录 一、介绍 二、业务统计 三、代码实现 一、介绍 Spark SQL有三种不一样实现方式:(1)使用DataFrame与RDD结合的方式。(2)纯粹使用DataFrame的方式。(3)使用DataSet的方式。本文仅介绍第二种方式,其余方式能够参考源码(见底部)。 DataFrameAPI是从Spark1.3开始就有的,它是一种以RDD为基础的分布式无类型数据集,相似于传统数据库中的二维表
相关文章
相关标签/搜索