6大数据实战系列-sparkSql实战

sparkSql两个最重要的类SqlContext、DataFrame,DataFrame功能强大,可以与rdd互转换、支持sql操做如sql().where.order.join.groupBy.limit等。 SparkSql的查询响应性能是hive的几何级倍数,而且SparkSql支持多种数据源操做包括hive、hdfs、rdd、json、mysql,本文先讲解hive、hdfs、rdd、j
相关文章
相关标签/搜索