大数据Spark企业级实战版【学习笔记】----Spark Shark& Spark SQL

4. Spark Shark        Shark即Hive on Spark,本质上是通过Hive的HQL解析,Shark在Spark1.0.0由于整合度和性能等原因,已被Spark官方团队停止开发。Shark在实现上是把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,Shark获取HDFS上的数据和文件并放到Spark上运算。Shark的最大特
相关文章
相关标签/搜索