Spark入门之六:SparkSQL实战

介绍 SparkSQL引入了一种新的RDD——SchemaRDD,SchemaRDD由行对象(Row)以及描述行对象中每列数据类型的Schema组成;SchemaRDD很象传统数据库中的表。SchemaRDD能够经过RDD、Parquet文件、JSON文件、或者经过使用hiveql查询hive数据来创建。SchemaRDD除了能够和RDD同样操做外,还能够经过registerTempTable注册
相关文章
相关标签/搜索