Posted on 2014-11-21 10:57 libobo1984 阅读(462) 评论(0) 编辑 收藏html
因为目前公司大量的数据存储在HBase中,各个业务线须要对HBase进行即时查询,可是又不方便实现本身的基于HBase Client的API的数据访问实现,他们但愿可以像Hive对HDFS中的数据进行ETL同样,能够对HBase中的数据进行SQL操做java
咱们最初考虑的方式是Hive On HBase,这样主要思想是将数据存储在HBase中,设置一张Hive表,关联HBae中的数据,具体原理如sql
http://www.blogjava.net/ivanwan/archive/2011/01/10/342685.htmlapache
可是如今咱们经过post
http://www.infoq.com/cn/news/2013/02/Phoenix-HBase-SQLspa
http://blog.csdn.net/colorant/article/details/8645081.net
发觉,HBase Phoenix实际上可能更快,因此咱们决定选型HBase Phoenix,并在CDH5.0.2中进行安装,实际安装过程当中很是简单code
经过执行server
#whereis hbase hbase: /usr/bin/hbase /etc/hbase /usr/lib/hbase
将phoenix-4.2.0-server.jar 拷贝到每一个节点的/usr/lib/hbase/lib中,重启HBase集群htm
并选择一个机器做为客户端,加入phoenix-4.2.0-client.jar,设置环境变量
1 2 |
|
而后在客户端启动
./sqlline.py locahost便可
详情参见
http://phoenix.apache.org/download.html