HBase shell 命令介绍

时间 2019-11-17

原文原文链接

HBase shell是HBase的一套命令行工具，相似传统数据中的sql概念，可使用shell命令来查询HBase中数据的详细状况。安装完HBase以后，若是配置了HBase的环境变量，只要在shell中执行hbase shell就能够进入命令行界面，HBase的搭建能够参考个人上一篇文章：hbase分布式集群搭建html

HBase介绍

HBase简介

HBase的名字的来源于Hadoop database，即hadoop数据库，不一样于通常的关系数据库，它是一个适合于非结构化数据存储的数据库，并且它是基于列的而不是基于行的模式。sql

HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现，它利用Hadoop HDFS做为其文件存储系统，利用Hadoop MapReduce来处理HBase中的海量数据，利用Zookeeper做为协同服务。shell

hbase提供了一个shell的终端给用户交互。使用命令hbase shell进入命令界面。经过执行 help能够看到命令的帮助信息。数据库

HBase的表结构

HBase以表的形式存储数据。表有行和列组成。列划分为若干个列族/列簇(column family)。数组

{:.center}
服务器

如上图所示，key1,key2,key3是三条记录的惟一的row key值，column-family1,column-family2,column-family3是三个列族，每一个列族下又包括几列。好比column-family1这个列族下包括两列，名字是column1和column2，t1:abc,t2:gdxdf是由row key1和column-family1-column1惟一肯定的一个单元cell。这个cell中有两个数据，abc和gdxdf。两个值的时间戳不同，分别是t1,t2, hbase会返回最新时间的值给请求者。并发

这些名词的具体含义以下：nosql

一、Row Key分布式

与nosql数据库们同样,row key是用来检索记录的主键。访问hbase table中的行，只有三种方式：工具

经过单个row key访问
经过row key的range
全表扫描

Row key行键 (Row key)能够是任意字符串(最大长度是 64KB，实际应用中长度通常为 10-100bytes)，在hbase内部，row key保存为字节数组。

存储时，数据按照Row key的字典序(byte order)排序存储。设计key时，要充分排序存储这个特性，将常常一块儿读取的行存储放到一块儿。(位置相关性)

注意：

字典序对int排序的结果是1,10,100,11,12,13,14,15,16,17,18,19,2,20,21,…,9,91,92,93,94,95,96,97,98,99。要保持整形的天然序，行键必须用0做左填充。

行的一次读写是原子操做 (不论一次读写多少列)。这个设计决策可以使用户很容易的理解程序在对同一个行进行并发更新操做时的行为。

二、列族 column family

hbase表中的每一个列，都归属与某个列族。列族是表的chema的一部分(而列不是)，必须在使用表以前定义。列名都以列族做为前缀。例如courses:history，courses:math都属于courses这个列族。

访问控制、磁盘和内存的使用统计都是在列族层面进行的。实际应用中，列族上的控制权限能帮助咱们管理不一样类型的应用：咱们容许一些应用能够添加新的基本数据、一些应用能够读取基本数据并建立继承的列族、一些应用则只容许浏览数据（甚至可能由于隐私的缘由不能浏览全部数据）。

三、单元 Cell

HBase中经过row和columns肯定的为一个存贮单元称为cell。由{row key, column( =<family> + <label>), version} 惟一肯定的单元。cell中的数据是没有类型的，所有是字节码形式存贮。

四、时间戳 timestamp

每一个cell都保存着同一份数据的多个版本。版本经过时间戳来索引。时间戳的类型是 64位整型。时间戳能够由hbase(在数据写入时自动 )赋值，此时时间戳是精确到毫秒的当前系统时间。时间戳也能够由客户显式赋值。若是应用程序要避免数据版本冲突，就必须本身生成具备惟一性的时间戳。每一个cell中，不一样版本的数据按照时间倒序排序，即最新的数据排在最前面。

为了不数据存在过多版本形成的的管理 (包括存贮和索引)负担，hbase提供了两种数据版本回收方式。一是保存数据的最后n个版本，二是保存最近一段时间内的版本（好比最近七天）。用户能够针对每一个列族进行设置。

Hbase shell

HBase Shell的一些基本操做命令，列出了几个经常使用的HBase Shell命令，以下：

名称	命令表达式
查看存在哪些表	list
建立表	create '表名称', '列名称1','列名称2','列名称N'
添加记录	put '表名称', '行名称', '列名称:', '值'
查看记录	get '表名称', '行名称'
查看表中的记录总数	count '表名称'
删除记录	delete '表名' ,'行名称' , '列名称'
删除一张表	先要屏蔽该表，才能对该表进行删除，第一步 disable '表名称' 第二步 drop '表名称'
查看全部记录	scan "表名称"
查看某个表某个列中全部数据	scan "表名称" , ['列名称:']
更新记录	就是重写一遍进行覆

通常操做

一、HBase shell中的帮助命令很是强大，使用help得到所有命令的列表，使用help ‘command_name’得到某一个命令的详细信息。例如：

help ‘list'

二、查询服务器状态

status

三、查询Hbase版本：

version

四、查看全部表

list

增删改

一、建立一个表

create 'member','member_id','address','info’

二、得到表的描述

describe 'member'

三、添加一个列族

alter 'member', 'id'

四、删除一个列族

alter 'member', {NAME => 'member_id', METHOD => 'delete’}

五、删除列

1）经过delete命令，咱们能够删除id为某个值的‘info:age’字段，接下来的get就无视了

delete 'member','debugo','info:age'
get 'member','debugo','info:age'

2）删除整行的值：deleteall

deleteall 'member','debugo'
get 'member',’debugo'

六、经过enable和disable来启用/禁用这个表,相应的能够经过is_enabled和is_disabled来检查表是否被禁用。

is_enabled 'member'
is_disabled 'member'

七、使用exists来检查表是否存在

exists 'member'

八、删除表须要先将表disable。

disable 'member'
drop 'member'

九、put

在HBase shell中，咱们能够经过put命令来插入数据。例如咱们新建立一个表，它拥有id、address和info三个列簇，并插入一些数据。列簇下的列不须要提早建立，在须要时经过:来指定便可。

create 'member','id','address','info'
# 数据
put 'member', 'debugo','id','11'
put 'member', 'debugo','info:age','27'
put 'member', 'debugo','info:birthday','1987-04-04'
put 'member', 'debugo','info:industry', 'it'
put 'member', 'debugo','address:city','beijing'
put 'member', 'debugo','address:country','china'
put 'member', 'Sariel', 'id', '21'
put 'member', 'Sariel','info:age', '26'
put 'member', 'Sariel','info:birthday', '1988-05-09 '
put 'member', 'Sariel','info:industry', 'it'
put 'member', 'Sariel','address:city', 'beijing'
put 'member', 'Sariel','address:country', 'china'
put 'member', 'Elvis', 'id', '22'
put 'member', 'Elvis','info:age', '26'
put 'member', 'Elvis','info:birthday', '1988-09-14 '
put 'member', 'Elvis','info:industry', 'it'
put 'member', 'Elvis','address:city', 'beijing'
put 'member', 'Elvis','address:country', 'china'

查询

一、查询表中有多少行：count

count 'member'

二、get

1)获取一个id的全部数据

get 'member', ‘Sariel'

2)得到一个id，一个列簇（一个列）中的全部数据:

get 'member', 'Sariel', 'info'

三、查询整表数据

scan 'member'

四、扫描整个列簇

scan 'member', {COLUMN=>'info'}

五、指定扫描其中的某个列：

scan 'member', {COLUMNS=> 'info:birthday'}

六、除了列（COLUMNS）修饰词外，HBase还支持Limit（限制查询结果行数），STARTROW（ROWKEY起始行。会先根据这个key定位到region，再向后扫描）、STOPROW(结束行)、TIMERANGE（限定时间戳范围）、VERSIONS（版本数）、和FILTER（按条件过滤行）等。好比咱们从Sariel这个rowkey开始，找下一个行的最新版本

scan 'member', { STARTROW => 'Sariel', LIMIT=>1, VERSIONS=>1}

七、Filter是一个很是强大的修饰词，能够设定一系列条件来进行过滤。好比咱们要限制某个列的值等于26

scan 'member', FILTER=>"ValueFilter(=,'binary:26’)"

值包含6这个值：

scan 'member', FILTER=>"ValueFilter(=,'substring:6')"

列名中的前缀为birthday的

scan 'member', FILTER=>"ColumnPrefixFilter('birth') “

FILTER中支持多个过滤条件经过括号、AND和OR的条件组合

scan 'member', FILTER=>"ColumnPrefixFilter('birth') AND ValueFilter ValueFilter(=,'substring:1988')"

PrefixFilter是对Rowkey的前缀进行判断,这是一个很是经常使用的功能。

scan 'member', FILTER=>"PrefixFilter('E')"

参考：
hbase shell基础和经常使用命令详解
 HBase Shell 经常使用操做

1. HBase shell 命令介绍
2. HBase shell命令介绍
3. hbase shell 命令
4. Shell echo命令介绍
5. hbase shell命令2
6. 【四】HBase Shell命令
7. hbase shell基础命令
8. HBase(1)：shell基本命令
9. 2.HBase shell命令大全
10. HBase Shell操做命令
更多相关文章...
• 网站主机介绍 - 网站主机教程
• Docker info 命令 - Docker命令大全
• Docker 清理命令
• Java Agent入门实战（一）-Instrumentation介绍与使用