在 hue(02)、Hue集成Hadoop集群(HDFS和YARN) 中咱们在hue中集成了hdfs和yarn,能够很方便的在hue中操做hdfs中的数据和查看MapReduce的做业执行状况。本文咱们将在hue中集成hive数据仓库,用替代hive本身的hwi服务,能够很方便的在hue中进行hive的sql查询等操做。mysql
1.hadoop集群服务sql
2.hive-mysql元数据库服务数据库
3.hive服务api
4.hue4.1session
打开hue的/desktop/conf/目录下的 pseudo-distributed.ini文件 oracle
编辑pseudo-distributed.ini文件 ,找到[beeswax]这一节,修改信息链接为hdpc01的机器上的Hive数据仓库服务,修改信息以下:工具
hive_server_host=hdpc01oop
hive_server_port=10000spa
server_conn_timeout=120.net
list_partitions_limit=10000
query_partitions_limit=10
download_row_limit=100000
max_number_of_sessions=10
1.启动hadoop集群
启动hadoop三台机器,而后在主节点机器上启动hadoop集群:start-all.sh
2.启动Hiveserver服务
在hive机器上启动hiveserver服务:hive --service hiveserver2 或者hive --service hiveserver2 &
3.启动Hive Metastore服务
在hive机器上启动Hive Metastore服务:hive --service metastore或者hive --service metastore &
看到以下信息,说明启动完成:
4.启动Hue服务
在hue的/bulid/env/bin/目录下执行./supervisor 命令启动hue服务
5.验证启动
在终端输入jps -ml查看:
能够看到hadoop集群个hive服务启动都正常
登录Hue服务,点击hive能够看到hive的默认default的库,和咱们以前使用hive时建的表
查看hive表的详细信息,右击表点击Open in Browser在右边的Table Browser视图中,能够看到表的结构及字段自定义、部分数据等
点击columns标签能够看到表字段的详细信息
点击sample标签能够看到该表所有的数据信息
使用hue中的hive查询器查询hive表中的数据
在hue中还有更多能够操做hive的方式,你们能够本身尝试别的,本文先这么多基本的操做
1.hue提示Could not start SASL: Error in sasl_client_start (-4) SASL(-4)的异常
问题缘由:由于系统缺乏了相关的依赖
解决办法:咱们在hue所在主机安装如下的依赖
yum install cyrus-sasl-plain cyrus-sasl-devel cyrus-sasl-gssapi
文本的使用hue链接操做hive数据仓库比较以前hive本身的hwi功能更强大,同时hue支持更多的应用,集成在一块儿更像是一个操做、监控为一体的平台化的工具,在后面的文章咱们还继续去使用hue集成HBase、mysql、oracle等