Hadoop---HUE(Hadoop User Experience)

HUE=Hadoop User Experience

Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。

通过使用Hue,可以在浏览器端的Web控制台上与Hadoop集群进行交互,来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等。(就是支持提供各种Web图形化界面的)。

1、架构

https://images2018.cnblogs.com/blog/1027015/201805/1027015-20180505162748497-312245850.png

2、功能

  1. 访问HDFS和文件浏览
  2. 通过web调试和开发hive以及数据结果展示
  3. 查询solr和结果展示,报表生成
  4. 通过web调试和开发impala交互式SQL Query
  5. spark调试和开发
  6. Pig开发和调试
  7. oozie任务的开发,监控,和工作流协调调度
  8. Hbase数据查询和修改,数据展示
  9. Hive的元数据(metastore)查询
  10. MapReduce任务进度查看,日志追踪
  11. 创建和提交MapReduce,Streaming,Java job任务
  12. Sqoop2的开发和调试
  13. Zookeeper的浏览和编辑
  14. 数据库(MySQL,PostGres,SQlite,Oracle)的查询和展示

3、适用场景

Hue是开源的,而且支持任何版本的hadoop。

各种开源项目都有自己的使用方式和开发接口,hue只不过是统一了各个项目的开发方式在一个接口里,这样比较方便,不用一会准备使用hive时,就开一个hive的cli终端,一会用pig,就得开一个pig的grunt,或者又想查Hbase,又得需要开一个Hbase的shell终端。如果使用hadoop生态系统的组件很多的情况下,使用hue还是比较方便的,另外一个好处就是hue提供了一个web的界面来开发和调试任务,不用频繁登陆Linux来操作了。

可以在任何时候,只要能上网,就可以通过hue来开发和调试数据,不用再装Linux的客户端来远程登陆操作了,这也是B/S架构的好处。

官方Demo地址https://demo.gethue.com/

官方网站:https://gethue.com/