Impala,Hive,SparkSQL数据清洗后对后续查询的影响比较

Impala,Hive,SparkSQL数据清洗后对后续查询的影响比较 SparkSQL和Impala执行的时间会比较快,Hive明显慢不少,可是这里比较不是执行单次查询效率,而是三种方式清洗后数据产生结果小文件对后续使用的影响。 首先准备好2000万表记录,做为外部表建好。 而后把出生日期星座划分,结果生成表格存放。三种方式存放3个不一样表格。 #########################
相关文章
相关标签/搜索