暑假周进度总结(5)

本周学习了教材中的第四章:分布式数据库Hbase数据库

经过学习本章内容学习到HBase跟传统关系数据库有很大的区别,服务器

(1)数据类型:关系数据库都是运用了关系模型,主体-属性的方法来找出对应关系来进行存储,而HBase采用了很简单的数据模型,他将数据存储为未解释的字符串。分布式

(2)数据操做:关系数据库有不少操做,表链接等,HBase不存在这些复杂的操做,只有增删改查。函数

(3)存储模式:关系数据库是经过行来进行操做,例如增长完整的一行,删除完整的一行。而HBase是经过列来进行操做,同时存储的时候HBase也是经过列来进行存储的学习

(4)数据索引:传统关系数据库是二维表,而HBase是四维表,关系数据库经过一个2个关键值便能索引到数据,而HBase只有一个索引---行键。索引

(5)数据维护:关系数据库中,更新操纵新数据会覆盖就数据,而在HBase中会保留旧数据。字符串

(6)可伸缩性:关系数据库由于是进行行操做,一旦表建好了,增长属性就很难进行操做,而HBase是经过列操做,增长一列来进行横向扩展就变得更容易。io

HBase的四个维度:行键、列族、列名、时间戳。ast

三个主要功能组件:1.库函数:提供客户端和HBase的端口链接访问,2.Master主服务器:负责管理和维护HBase表的分区信息,3.Region服务器:负责存储和维护分配给本身的Region,处理来自客户端的读写请求。原理

三层寻址原理:既能知足大量数据的地址的存储还能知足准确的定位。客户端先访问ROOT表找到存放Region的META表,经过META表来找到存放region的region地址。

相关文章
相关标签/搜索