HBase是一个开源的高可靠性、高性能、可伸缩、并不是创建在关系模型基础上的分布式数据库,用以存储大规模结构化数据,是非关系型(NoSQL)数据库,由Chang等人基于Google的Bigtable开发而成的。HBase的目标是存储并处理大型的数据,更具体来讲是只须要使用普通的硬件配置便可处理成千上万的行和列组成的大数据。 node
转载请注明出处: http://hanlaiming.freetzi.com/?p=156 shell
1、实验环境 数据库
1,Hadoop 版本 1.2.1,全分布安装 一个主节点minglaihan,两个子节点node1和node2 apache
2,Zookeeper版本3.4.5 分布式
3,Hbase版本0.94.13 oop
4,Java版本1.7.0_45 性能
2、配置HBase 学习
一、安装好Hadoop后,须要安装Zookeeper和HBase,在apache官网下载相应版本,若是通常来讲最新版的都会不稳定,因此建议选取稳定版。 大数据
二、HBase启动顺序是Hadoop->Zookeeper->HBase,所以须要先安装Zookeeper,安装参考http://hanlaiming.freetzi.com/?p=164 spa
三、HBase配置以下文件:
修改conf/hbase-env.sh最后一行:
export HBASE_MANAGES_ZK=false
修改conf/regionservers:
修改hbase-site.xml:
<configuration> <property> <name>hbase.rootdir</name> <value>hdfs://minglaihan:9000/hbase</value> <description>HBase数据存储目录.</description> </property> <property> <name>hbase.cluster.distributed</name> <value>true</value> <description>指定Hadoop的运行模式:false单击分布或伪分布模式 true:彻底分布模式.</description> </property> <property> <name>hbase.master</name> <value>hdfs://minglaihan:60000</value> <description>指定Msater位置.</description> </property> <property> <name>hbase.zookeeper.quorum</name> <value>minglaihan,node1,node2</value> <description>指定ZooKeeper集群.</description> </property> </configuration>
4,经过scp命令将配置好的HBase文件传送到各个节点。
3、启动HBase
1,注意启动HBase前确保Hadoop和Zookeeper已经启动。在HBase的bin目录下执行start-hbase.sh或者./start-hbase.sh,
2,进入http://minglaihan:60010查看HBase状态
3,进入HBase Shell
4,一些HBase的数据库操做须要认真看这方面的资料,在此不赘述。说明:exit退出当前hbase shell环境,shutdown则是关闭Hbase服务。关闭这些服务的顺序:HBase->Zookeeper->Hadoop
4、总结
HBase对之后Hadoop的MapReduce开发模式有很重要的意义,安装只是开始,还须要更努力的学习!