Hive-On-Spark

1 HiveOnSpark简介 Hive On Spark (跟hive没太大的关系,就是使用了hive的标准(HQL, 元数据库、UDF、序列化、反序列化机制))java Hive原来的计算模型是MR,有点慢(将中间结果写入到HDFS中)mysql Hive On Spark 使用RDD(DataFrame),而后运行在spark 集群上sql 真正要计算的数据是保存在HDFS中,mysql这个
相关文章
相关标签/搜索