大数据开发面试:impala和hive的比较

Impala: Cloudera公司推出,提供对于hdfs,hbase数据的高性能,低延迟的交互式sql 查询功能 基于hive,使用内存计算,兼顾数据仓库,具有实时,批处理,多并发等优点 是CDH首选的PB级大数据实时查询,分析引擎。 内存计算比I/O计算要快,内存计算不依赖于磁盘,受制于内存大小,对于磁盘的要求更高。 Hive是基于MapReduce,内存可以很小。 Map阶段是一条一条的处理
相关文章
相关标签/搜索