SparkSQL的发展历史

Hadoop刚开始出来的时候,使用的是hadoop自带的分布式计算系统MapReduce,可是MapReduce的使用难度较大,因此就开发了Hive,Hive编程用的是类SQL的HQL的语句,这样编程的难度就大大的下降了,Hive的运行原理就是将HQL语句通过语法解析、逻辑计划、物理计划转化成MapReduce程序执行。当Spark出来之后,Spark团队也开发了一个Shark,就是在Spark集
相关文章
相关标签/搜索