索引原理-btree索引与hash索引的区别

  btree索引与hash索引的区别,以前不清楚,mark一下。算法

  Hash索引结构的特殊性,其检索效率很是高,索引的检索能够一次定位,不像B-Tree索引须要从根节点到枝节点,最后才能访问到页节点这样屡次的IO访问,因此Hash索引的查询效率要远高于B-Tree索引。数据库

  可能不少人又有疑问了,既然Hash索引的效率要比B-Tree高不少,为何你们都不用Hash索引而还要使用B-Tree索引呢?任何事物都是有两面性的,Hash索引也同样,虽然Hash索引效率高,可是Hash索引自己因为其特殊性也带来了不少限制和弊端,主要有如下这些:性能

  一、Hash索引仅仅可以知足“=”,“IN”和“<=>”查询,不能使用范围查询。指针

  因为Hash索引比较的是进行Hash运算以后的Hash值,因此它只能用于等值的过滤,不能用于基于范围的过滤,由于进过相应的Hash算法处理以后的Hash值的大小关系,并不能保证和Hash运算前彻底同样。排序

  二、Hash索引没法被用来避免数据的排序操做索引

   因为Hash索引中存放的是通过Hash计算以后的Hash值,并且Hash值的大小管理并不必定和Hash运算前的键值彻底同样,因此数据库没法利用索引的数据来避免任何排序运算。hash

  三、Hash索引不能利用部分索引查询效率

  对于组合索引,Hash索引在计算Hash值的时候是组合索引键合并后再一块儿计算Hashs值,而不是单独计算Hash值,因此经过组合索引的前面一个或者几个索引键进行查询的时候,Hash索引也没法被利用。数据

  四、Hash索引在任什么时候候都不能避免表扫描查询

  前面已经知道,Hash索引是将索引键经过Hash运算以后,将Hash运算结果的Hash值和对应的行指针信息存放于一个Hash表中,因为不一样索引键存在相同Hash值,因此即便取知足某个Hash键值的数据的记录条数,也没法从Hash索引中年直接完成查询,还要经过访问表中实际数据进行相应的比较,并获得相应的结果。

  五、Hash索引遇到大量Hash值相等的状况后性能不必定会比B-Tree索引高

  对于选择性比较低的索引键,若是建立Hash索引,那么将会存在大量记录指针信息存于同一个Hash值相关联。这样要定位某一条记录时就会很是麻烦,会浪费屡次表数据的访问,而形成总体性能低下。

相关文章
相关标签/搜索