hue(04)、Hue集成Hive数据仓库

时间 2019-11-06

标签 hue 集成 hive 数据仓库栏目 Hadoop 繁體版

原文原文链接

在 hue(02)、Hue集成Hadoop集群(HDFS和YARN) 中咱们在hue中集成了hdfs和yarn，能够很方便的在hue中操做hdfs中的数据和查看MapReduce的做业执行状况。本文咱们将在hue中集成hive数据仓库，用替代hive本身的hwi服务，能够很方便的在hue中进行hive的sql查询等操做。mysql

1、环境准备

1.hadoop集群服务sql

2.hive-mysql元数据库服务数据库

3.hive服务api

4.hue4.1session

2、集成配置

打开hue的/desktop/conf/目录下的 pseudo-distributed.ini文件 oracle

编辑pseudo-distributed.ini文件，找到[beeswax]这一节，修改信息链接为hdpc01的机器上的Hive数据仓库服务，修改信息以下：工具

hive_server_host=hdpc01oop

hive_server_port=10000spa

server_conn_timeout=120.net

list_partitions_limit=10000

query_partitions_limit=10

download_row_limit=100000

max_number_of_sessions=10

3、集成准备

1.启动hadoop集群

启动hadoop三台机器，而后在主节点机器上启动hadoop集群：start-all.sh

2.启动Hiveserver服务

在hive机器上启动hiveserver服务：hive --service hiveserver2 或者hive --service hiveserver2 &

3.启动Hive Metastore服务

在hive机器上启动Hive Metastore服务：hive --service metastore或者hive --service metastore &

看到以下信息，说明启动完成：

4.启动Hue服务

在hue的/bulid/env/bin/目录下执行./supervisor 命令启动hue服务

5.验证启动

在终端输入jps -ml查看：

能够看到hadoop集群个hive服务启动都正常

4、集成验证及简单使用

登录Hue服务，点击hive能够看到hive的默认default的库，和咱们以前使用hive时建的表

查看hive表的详细信息，右击表点击Open in Browser在右边的Table Browser视图中，能够看到表的结构及字段自定义、部分数据等

点击columns标签能够看到表字段的详细信息

点击sample标签能够看到该表所有的数据信息

使用hue中的hive查询器查询hive表中的数据

在hue中还有更多能够操做hive的方式，你们能够本身尝试别的，本文先这么多基本的操做

5、问题总结

1.hue提示Could not start SASL: Error in sasl_client_start (-4) SASL(-4)的异常

问题缘由：由于系统缺乏了相关的依赖

解决办法：咱们在hue所在主机安装如下的依赖

yum install cyrus-sasl-plain cyrus-sasl-devel cyrus-sasl-gssapi

六、文末总结

文本的使用hue链接操做hive数据仓库比较以前hive本身的hwi功能更强大，同时hue支持更多的应用，集成在一块儿更像是一个操做、监控为一体的平台化的工具，在后面的文章咱们还继续去使用hue集成HBase、mysql、oracle等