Shark简介、部署及编译小结

Shark简介html Shark即Hive on Spark,本质上是经过Hive的HQL解析,把HQL翻译成Spark上的RDD操做,而后经过Hive的metadata获取数据库里的表信息,实际HDFS上的数据和文件,会由Shark获取并放到Spark上运算。Shark的特色就是快,彻底兼容Hive,且能够在shell模式下使用rdd2sql()这样的API,把HQL获得的结果集,继续在sca
相关文章
相关标签/搜索