这里,我所基于的基本环境及其配置状况,以下所示:
?CentOS-6.6 (Final)
?JDK-1.7.0_25
?Maven-3.2.1
?Git-1.7.1
?Hue-3.7.0(branch-3.7.1)
?Hadoop-2.2.0
?Hive-0.14
?Python-2.6.6python
基于上面的软件工具,要保证正确安装和配置。须要说明的是,咱们经过Hue来执行Hive查询,须要启动HiveServer2服务:
cd /usr/local/hive
bin/hiveserver2 &mysql
不然经过Hue Web控制没法执行Hive查询。git
安装配置github
我新建了一个hadoop用户,以hadoop用户,首先使用yum工具来安装Hue相关的依赖软件:
sudo yum install krb5-devel cyrus-sasl-gssapi cyrus-sasl-deve libxml2-devel libxslt-devel mysql mysql-devel openldap-devel python-devel python-simplejson sqlite-develweb
yum install cyrus-sasl-plainsql
而后,执行以下命令进行Hue软件包的下载构建:
cd /usr/local/
sudo git clone https://github.com/cloudera/hue.git branch-3.7.1
sudo chown -R hadoop:hadoop branch-3.7.1/
cd branch-3.7.1/
make appsjson
上述过程若是没有任何问题,咱们就已经安装好Hue。Hue的配置文件为/usr/local/branch-3.7.1/desktop/conf/pseudo-distributed.ini,默认的配置文件不能正常运行Hue,因此须要修改其中的内容,与咱们对应的Hadoop集群配置相对应。该配置文件根据整合不一样的软件,将配置分红多个段,每一个段下面还有子段,便于管理配置,以下所示(省略子段名称):
?desktop
?libsaml
?libopenid
?liboauth
?librdbms
?hadoop
?filebrowser
?liboozie
?oozie
?beeswax
?impala
?pig
?sqoop
?proxy
?hbase
?search
?indexer
?jobsub
?jobbrowser
?zookeeper
?spark
?useradmin
?libsentryapi
咱们很容易根据须要来配置本身须要的内容。咱们修改配置文件的状况,以下表所示:app
Hue配置段 Hue配置项 Hue配置值 说明
desktop default_hdfs_superuser hadoop HDFS管理用户
desktop http_host 10.10.4.125 Hue Web Server所在主机/IP
desktop http_port 8000 Hue Web Server服务端口
desktop server_user hadoop 运行Hue Web Server的进程用户
desktop server_group hadoop 运行Hue Web Server的进程用户组
desktop default_user yanjun Hue管理员
hadoop/hdfs_clusters fs_defaultfs hdfs://hadoop6:8020 对应core-site.xml配置项fs.defaultFS
hadoop/hdfs_clusters hadoop_conf_dir /usr/local/hadoop/etc/hadoop Hadoop配置文件目录
hadoop/yarn_clusters resourcemanager_host hadoop6 对应yarn-site.xml配置项yarn.resourcemanager.hostname
hadoop/yarn_clusters resourcemanager_port 8032 ResourceManager服务端口号
hadoop/yarn_clusters resourcemanager_api_url http://hadoop6:8088 对应于yarn-site.xml配置项yarn.resourcemanager.webapp.address
hadoop/yarn_clusters proxy_api_url http://hadoop6:8888 对应yarn-site.xml配置项yarn.web-proxy.address
hadoop/yarn_clusters history_server_api_url http://hadoo6:19888 对应mapred-site.xml配置项mapreduce.jobhistory.webapp.address
beeswax hive_server_host 10.10.4.125 Hive所在节点主机名/IP
beeswax hive_server_port 10000 HiveServer2服务端口号
beeswax hive_conf_dir /usr/local/hive/conf Hive配置文件目录webapp
上面主要配置了Hadoop集群相关的内容,以及Hive(beeswax段配置的是Hive,经过HIveServer2与Hive交互)。最后,启动Hue服务,执行以下命令:
cd /usr/local/branch-3.7.1/
build/env/bin/supervisor &
Hue功能验证