sparkSql(hive) 复合数据类型的使用

在Hive中能够使用复合数据类型,有三种经常使用的类型:Array 数组,Map 字典,Struct结构。在sparkSql中RDD能够转换成很是灵活的DataFrame,有下面几种语法:sql rdd=sc.parallelize([1,2,3])数组 a=rdd.map(lambda item:Row(item))数据结构 schema=['test_colum']app a=a.toDF(s
相关文章
相关标签/搜索