前面一篇博客《高可用Hadoop平台-Ganglia安装部署》,为你们介绍了Ganglia在Hadoop中的集成,今天为你们介绍另外一款工具——Hue,该工具功能比较丰富,下面是今天为你们分享的内容目录:html
本文所使用的环境是Apache Hadoop-2.6版本,下面开始今天的内容分享。python
Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。经过使用Hue咱们能够在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操做HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等。mysql
Hue在数据库方面,默认使用的是SQLite数据库来管理自身的数据,包括用户认证和受权,另外,能够自定义为MySQL数据库、Postgresql数据库、以及Oracle数据库。其自身的功能包含有:git
下面就经过集成部署,来预览相关功能。github
本文所使用的Hadoop环境是基于Apache社区版的Hadoop2.6,在集成到Hadoop上,Hue的部署过程是有点复杂的。Hue在CDH上是能够轻松的集成的,咱们在使用CDH的那套管理系统是,能够很是容易的添加Hue的相关服务。然而,在实际业务场景中,每每Hadoop集群使用的并不是都是CDH版的,在Cloudera公司使用将其贡献给Apache基金会后,在Hadoop的集成也有了较好的改善,下面就为你们介绍如何去集成到Apache的社区版Hadoop上。web
在集成Hue工具时,咱们须要去下载对应的源码,该系统是开源免费的,能够在GitHub上下载到对应的源码,下载地址以下所示:sql
git@github.com:cloudera/hue.git
咱们使用Git命令将其克隆下来,命令以下所示:数据库
git clone git@github.com:cloudera/hue.git
而后,咱们在Hadoop帐号下安装Hue须要的依赖环境,命令以下所示:json
sudo yum install krb5-devel cyrus-sasl-gssapi cyrus-sasl-deve libxml2-devel libxslt-devel mysql mysql-devel openldap-devel python-devel python-simplejson sqlite-devel
等待其安装完毕。api
在基础环境准备完成后,咱们开始对Hue的源码进行编译,编译的时候,Python的版本须要是2.6+以上,否则在编译的时候会出现错误,编译命令以下所示:
[hadoop@nna ~]$ cd hue [hadoop@nna ~]$ make apps
等待其编译完成,在编译的过程当中有可能会出现错误,在出现错误时Shell控制台会提示对应的错误信息,你们能够根据错误信息的提示来解决对应的问题,在编译完成后,咱们接下来须要对其作对应的配置,Hue的默认配置是启动本地的Web服务,这个咱们须要对其修改,供外网或者内网去访问其Web服务地址,咱们在Hue的根目录下的desktop/conf文件夹下加pseudo-distributed.ini文件,而后咱们对新增的文件添加以下内容:
vi pseudo-distributed.ini
[desktop] http_host=10.211.55.28 http_port=8000 [hadoop] [[hdfs_clusters]] [[[default]]] fs_defaultfs=hdfs://cluster1 logical_name=cluster1 webhdfs_url=http://10.211.55.26:50070/webhdfs/v1 hadoop_conf_dir=/home/hadoop/hadoop-2.6.0/etc/hadoop [beeswax] hive_server_host=10.211.55.17 hive_server_port=10000 # hive_conf_dir=/home/hive/warehouse [hbase] hbase_clusters=(cluster1|10.211.55.26:9090) hbase_conf_dir=/home/hadoop/hbase-1.0.1/conf
关于Hue的详细和更多配置须要,你们能够参考官方给的知道文档,链接地址以下 所示:
http://cloudera.github.io/hue/docs-3.8.0/manual.html
这里,Hue的集成就完成了,下面能够输入启动命令来查看,命令以下所示:
[hadoop@nna ~]$ /root/hue-3.7.1/build/env/bin/supervisor &
启动信息以下所示:
下面,在浏览器中输入对应的访问地址,这里我配置的Port是8000,在第一次访问时,须要输入用户名和密码来建立一个Administrator,这里须要在一步的时候须要注意下。
下面附上Hue的相应的截图预览,以下图所示:
在编译的时候,你们须要注意Hue的依赖环境,因为咱们的Hadoop集群不是CDH版本的,因此在集成Hue的服务不能像CDH上那么轻松。在Apache的Hadoop社区版上集成部署,会须要对应的环境,如果缺乏依赖,在编译的时候是会发生错误的。因此,这里须要特别留心注意,出错后,通常都会有提示信息的,你们能够根据提示检查定位出错误缘由。
这篇博客就和你们分享到这里,若是你们在研究学习的过程中有什么问题,能够加群进行讨论或发送邮件给我,我会尽我所能为您解答,与君共勉!