MySQL 哈希索引

哈希索引基于哈希表实现,只有精确匹配索引全部列的查询才有效。mysql

在MySQL中只有Memory引擎显示支持哈希索引,也是memory引擎表的默认索引类型。memory引擎是支持非惟一哈希索引的。若是多个列的哈希值相同,索引会以链表 的方式存放多个记录指针道同一个哈希条目中。sql

举个粒子:数据库

create table testhash(
fname varchar(50) not null,
lname varchar(50) not null,
key using hash(fname)
)engine=memory;


数据库中的数据:
mysql> select * from testhash;
+--------+-----------+
| fname  | lname     |
+--------+-----------+
| Baron  | Schwartz  |
| Arjen  | Lentz     |
| Peter  | Zaitsev   |
| Vadim  | Tkachenko |
+--------+-----------+
4 rows in set (0.00 sec)

假设f() 为哈希函数,f(fname) 的返回值是其哈希值,对应槽位。槽位是按顺序排列的。每一个槽位上的值指向数据。
(结构能够理解为 jdk 1.7 中的hashmap的数据结构,一个数组和链表的形式)
image.png数组

ERROR 1054 (42S22): Unknown column 'lane' in 'field list'
mysql> select lname from testhash where fname ='Peter';
+---------+
| lname   |
+---------+
| Zaitsev |
+---------+
1 row in set (0.00 sec)

查找的过程是是先计算'Peter'的哈希值,并使用改值寻找对应的记录指针,也就是计算f('Peter'),获得其哈希值为 3468 ,而后在对应的槽位上找到记录指针,找到对应行上的数据,最后一步是比较查找的值是否为'Peter' ,以确保就是要查找的行。数据结构

哈希索引的限制函数

  • 哈希索引值包含哈希值和行指针,而不存储字段值,因此不能使用索引中的值来避免读取行。
  • 哈希索引数据并非按照索引值顺序存储的,因此没法用于排序
  • 哈希索引也不支持部分索引匹配查找,由于哈希索引始终是使用索引列的所有内容来计算哈希值。例如,在数据列(A,B)上简历哈希索引,若是查询只有数据列A,则没法使用该索引。
  • 哈希索引只支持等值比较查询,包括 =、IN() 、<=> ,也不支持任何范围查找,例如 where price > 100.
  • 访问哈希索引的数据很是快,除非欧不少哈希冲突。当出现哈希冲突的时候,存储引擎必须遍历链表中的行指针,装进行比较,直到找到全部符合条件的行。
  • 若是哈希冲突不少的时候,一些索引维护操做的代价也会很是高。例如,若是在某个选择性很低(哈希冲突不少)的列上创建哈西索引,那么当从表中删除一行时,存储引擎须要遍历对应哈希值的链表中的每一行,找到并删除对应行的引用,冲突越多,代价越大。

InnoDB引擎有一个特殊的功能叫作"自适应哈希索引。当InnoDB注意到某些索引值被引用得很是频繁时,他会在内存中基于B-Tree索引智商在建立一个哈希索引,这样就让B-Tree索引也具备哈希索引的一些优势。这是一个彻底自动 的、内部的行为,用户没法控制或配置。不过若是有必要,彻底能够关闭该功能。spa

相关文章
相关标签/搜索