本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文连接,谢谢合做。html
文章是哥(mephisto)写的,SourceLink网络
上一篇,咱们讲述了HBase的协处理器。架构
下面咱们开始介绍Impala的介绍及安装。oop
一:定义
Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。和Hive相比,速度快了个数量级,具备很是好的交互式SQL执行。大数据
三:架构
Impala Daemonhtm
是Impala的核心进程,进程名叫作:impalad,运行在全部的数据节点上,能够读写数据,并接收客户端的查询请求,并行执行来自集群中其余节点的查询请求,将中间结果返回给调度节点。调用节点将结果返回给客户端。blog
Impala Statestore索引
状态管理进程,定时检查The Impala Daemon的健康情况,协调各个运行impalad的实例之间的信息关系,Impala正是经过这些信息去定位查询请求所要的数据,进程名叫作 statestored,在集群中只须要启动一个这样的进程,若是Impala节点因为物理缘由、网络缘由、软件缘由或者其余缘由而下线,Statestore会通知其余节点,避免查询任务分发到不可用的节点上。进程
Impala Catalog Service开发
元数据管理服务,进程名叫作 catalogd,将数据表变化的信息分发给各个进程。
一:新增服务
二:勾选Impala
三:分配服务
四:存储配置
五:添加服务进行中
六:添加完成
--------------------------------------------------------------------
到此,本章节的内容讲述完毕。
本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文连接,谢谢合做。
文章是哥(mephisto)写的,SourceLink