shark 简介

简介算法 Shark是一个新的数据分析系统,在集群上进行查询处理和复杂分析。Shark使用一种新的分布式内存抽象,为SQL查询和复杂分析函数提供了统一的运行引擎,并可以有效的容错。这种新的分布式内存抽象使得shark执行SQL查询的速度比Hive快100倍,执行机器学习算法比Hadoop快100倍。与以前的系统不一样,shark在取得如此良好性能的同时尽量的保留了相似于mapreduce的执行框架
相关文章
相关标签/搜索