Hbase寻址机制

 

1、寻址示意图

这里写图片描述

2、-ROOT-和.META.表结构

-ROOT-表结构

这里写图片描述

.META.行记录结构

这里写图片描述

3、寻址流程

现在假设我们要从Table2里面查询一条RowKey是RK10000的数据。那么我们应该遵循以下步骤: 
1. 从.META.表里面查询哪个Region包含这条数据。 
2. 获取管理这个Region的RegionServer地址。 
3. 连接这个RegionServer, 查到这条数据。

系统如何找到某个row key (或者某个 row key range)所在的region 
bigtable 使用三层类似B+树的结构来保存region位置。 
第一层: 保存zookeeper里面的文件,它持有root region的位置。 
第二层:root region是.META.表的第一个region其中保存了.META.表其它region的位置。通过root region,我们就可以访问.META.表的数据。 
第三层: .META.表它是一个特殊的表,保存了hbase中所有数据表的region 位置信息。

说明: 
(1) root region永远不会被split,保证了最需要三次跳转,就能定位到任意region 。 
(2).META.表每行保存一个region的位置信息,row key 采用表名+表的最后一行编码而成。 
(3) 为了加快访问,.META.表的全部region都保存在内存中。 
(4) client会将查询过的位置信息保存缓存起来,缓存不会主动失效,因此如果client上的缓存全部失效,则需要进行最多6次网络来回,才能定位到正确的region(其中三次用来发现缓存失效,另外三次用来获取位置信息)。

4、总结

Region定位流程:

这里写图片描述

  • 寻找RegionServer 
    ZooKeeper–> -ROOT-(单Region)–> .META.–> 用户表

  • -ROOT-表 
    表包含.META.表所在的region列表,该表只会有一个Region; 
    Zookeeper中记录了-ROOT-表的location。

  • .META.表  表包含所有的用户空间region列表,以及RegionServer的服务器地址。