哈希表和哈希函数html
在记录的存储位置和它的关键字之间是创建一个肯定的对应关系(映射函数),使每一个关键字和一个存储位置能惟一对应。这个映射函数称为哈希函数,根据这个原则创建的表称为哈希表(Hash Table),也叫散列表。程序员
以上描述,若是经过数学形式来描述就是:算法
若查找关键字为 key,则其值存放在 f(key) 的存储位置上。由此,不需比较即可直接取得所查记录。数据结构
注:哈希查找与线性表查找和树表查找最大的区别在于,不用数值比较。dom
冲突ide
若 key1 ≠ key2 ,而 f(key1) = f(key2),这种状况称为冲突(Collision)。函数
根据哈希函数f(key)和处理冲突的方法将一组关键字映射到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“像”做为记录在表中的存储位置,这一映射过程称为构造哈希表。this
构造哈希表这个场景就像汽车找停车位,若是车位被人占了,只能找空的地方停。spa
构造哈希表
由以上内容可知,哈希查找自己其实不费吹灰之力,问题的关键在于如何构造哈希表和处理冲突。设计
常见的构造哈希表的方法有 5 种:
(1)直接定址法
说白了,就是小学时学过的一元一次方程。
即 f(key) = a * key + b。其中,a和b 是常数。
(2)数字分析法
假设关键字是R进制数(如十进制)。而且哈希表中可能出现的关键字都是事先知道的,则可选取关键字的若干数位组成哈希地址。
选取的原则是使获得的哈希地址尽可能避免冲突,即所选数位上的数字尽量是随机的。
(3)平方取中法
取关键字平方后的中间几位为哈希地址。一般在选定哈希函数时不必定能知道关键字的所有状况,仅取其中的几位为地址不必定合适;
而一个数平方后的中间几位数和数的每一位都相关, 由此获得的哈希地址随机性更大。取的位数由表长决定。
(4)除留余数法
取关键字被某个不大于哈希表表长 m 的数 p 除后所得的余数为哈希地址。
即 f(key) = key % p (p ≤ m)
这是一种最简单、最经常使用的方法,它不只能够对关键字直接取模,也可在折叠、平方取中等运算以后取模。
注意:p的选择很重要,若是选的很差,容易产生冲突。根据经验,通常状况下能够选p为素数。
(5)随机数法
选择一个随机函数,取关键字的随机函数值为它的哈希地址,即 f(key) = random(key)。
一般,在关键字长度不等时采用此法构造哈希函数较为恰当。
解决冲突
设计合理的哈希函数能够减小冲突,但不能彻底避免冲突。
因此须要有解决冲突的方法,常见有两类
(1)开放定址法
若是两个数据元素的哈希值相同,则在哈希表中为后插入的数据元素另外选择一个表项。
当程序查找哈希表时,若是没有在第一个对应的哈希表项中找到符合查找要求的数据元素,程序就会继续日后查找,直到找到一个符合查找要求的数据元素,或者遇到一个空的表项。
例子
若要将一组关键字序列 {1, 9, 25, 11, 12, 35, 17, 29} 存放到哈希表中。
采用除留余数法构造哈希表;采用开放定址法处理冲突。
不妨设选取的p和m为13,由 f(key) = key % 13 能够获得下表。
须要注意的是,在上图中有两个关键字的探查次数为 2 ,其余都是1。
这个过程是这样的:
a. 12 % 13 结果是12,而它的前面有个 25 ,25 % 13 也是12,存在冲突。
咱们使用开放定址法 (12 + 1) % 13 = 0,没有冲突,完成。
b. 35 % 13 结果是 9,而它的前面有个 9,9 % 13也是 9,存在冲突。
咱们使用开放定址法 (35 + 1) % 13 = 10,没有冲突,完成。
(2)拉链法
将哈希值相同的数据元素存放在一个链表中,在查找哈希表的过程当中,当查找到这个链表时,必须采用线性查找方法。
在这种方法中,哈希表中每一个单元存放的再也不是记录自己,而是相应同义词单链表的头指针。
例子
若是对开放定址法例子中提到的序列使用拉链法,获得的结果以下图所示:

实现一个哈希表
假设要实现一个哈希表,要求
a. 哈希函数采用除留余数法,即 f(key) = key % p (p ≤ m)
b. 解决冲突采用开放定址法,即 f2(key) = (f(key)+i) % size (p ≤ m)
(1)定义哈希表的数据结构
class HashTable {
public
int key = 0;
//
关键字
public
int data = 0;
//
数值
public
int count = 0;
//
探查次数
}
(2)在哈希表中查找关键字key
根据设定的哈希函数,计算哈希地址。若是出现地址冲突,则按设定的处理冲突的方法寻找下一个地址。
如此反复,直到不冲突为止(查找成功)或某个地址为空(查找失败)。
/**
* 查找哈希表
* 构造哈希表采用除留取余法,即f(key) = key mod p (p ≤ size)
* 解决冲突采用开放定址法,即f2(key) = (f(key) + i) mod p (1 ≤ i ≤ size-1)
* ha为哈希表,p为模,size为哈希表大小,key为要查找的关键字
*/
public
int searchHashTable(HashTable[] ha,
int p,
int size,
int key) {
int addr = key % p;
//
采用除留取余法找哈希地址
//
若发生冲突,用开放定址法找下一个哈希地址
while (ha[addr].key != NULLKEY && ha[addr].key != key) {
addr = (addr + 1) % size;
}
if (ha[addr].key == key) {
return addr;
//
查找成功
}
else {
return FAILED;
//
查找失败
}
}
(3)删除关键字为key的记录
在采用开放定址法处理冲突的哈希表上执行删除操做,只能在被删记录上作删除标记,而不能真正删除记录。
找到要删除的记录,将关键字置为删除标记DELKEY。
public
int deleteHashTable(HashTable[] ha,
int p,
int size,
int key) {
int addr = 0;
addr = searchHashTable(ha, p, size, key);
if (FAILED != addr) {
//
找到记录
ha[addr].key = DELKEY;
//
将该位置的关键字置为DELKEY
return SUCCESS;
}
else {
return NULLKEY;
//
查找不到记录,直接返回NULLKEY
}
}
(4)插入关键字为key的记录
将待插入的关键字key插入哈希表
先调用查找算法,若在表中找到待插入的关键字,则插入失败;
若在表中找到一个开放地址,则将待插入的结点插入到其中,则插入成功。
public
void insertHashTable(HashTable[] ha,
int p,
int size,
int key) {
int i = 1;
int addr = 0;
addr = key % p;
//
经过哈希函数获取哈希地址
if (ha[addr].key == NULLKEY || ha[addr].key == DELKEY) {
//
若是没有冲突,直接插入
ha[addr].key = key;
ha[addr].count = 1;
}
else {
//
若是有冲突,使用开放定址法处理冲突
do {
addr = (addr + 1) % size;
//
寻找下一个哈希地址
i++;
}
while (ha[addr].key != NULLKEY && ha[addr].key != DELKEY);
ha[addr].key = key;
ha[addr].count = i;
}
}
(5)创建哈希表
先将哈希表中各关键字清空,使其地址为开放的,而后调用插入算法将给定的关键字序列依次插入。
public
void createHashTable(HashTable[] ha,
int[] list,
int p,
int size) {
int i = 0;
//
将哈希表中的全部关键字清空
for (i = 0; i < ha.length; i++) {
ha[i].key = NULLKEY;
ha[i].count = 0;
}
//
将关键字序列依次插入哈希表中
for (i = 0; i < list.length; i++) {
this.insertHashTable(ha, p, size, list[i]);
}
}
完整代码
1
class HashTable {
2
public
int key = 0;
//
关键字
3
public
int data = 0;
//
数值
4
public
int count = 0;
//
探查次数
5 }
6
7
public
class HashSearch {
8
9
private
final
static
int MAXSIZE = 20;
10
private
final
static
int NULLKEY = 1;
11
private
final
static
int DELKEY = 2;
12
private
final
static
int SUCCESS = 0;
13
private
final
static
int FAILED = 0xFFFFFFFF;
14
15
/**
16
* 查找哈希表
17
* 构造哈希表采用除留取余法,即f(key) = key mod p (p ≤ size)
18
* 解决冲突采用开放定址法,即f2(key) = (f(key) + i) mod p (1 ≤ i ≤ size-1)
19
* ha为哈希表,p为模,size为哈希表大小,key为要查找的关键字
20
*/
21
public
int searchHashTable(HashTable[] ha,
int p,
int size,
int key) {
22
int addr = key % p;
//
采用除留取余法找哈希地址
23
24
//
若发生冲突,用开放定址法找下一个哈希地址
25
while (ha[addr].key != NULLKEY && ha[addr].key != key) {
26 addr = (addr + 1) % size;
27 }
28
29
if (ha[addr].key == key) {
30
return addr;
//
查找成功
31 }
else {
32
return FAILED;
//
查找失败
33 }
34 }
35
36
/**
37
* 删除哈希表中关键字为key的记录
38
* 找到要删除的记录,将关键字置为删除标记DELKEY
39
*/
40
public
int deleteHashTable(HashTable[] ha,
int p,
int size,
int key) {
41
int addr = 0;
42 addr = searchHashTable(ha, p, size, key);
43
if (FAILED != addr) {
//
找到记录
44 ha[addr].key = DELKEY;
//
将该位置的关键字置为DELKEY
45
return SUCCESS;
46 }
else {
47
return NULLKEY;
//
查找不到记录,直接返回NULLKEY
48 }
49 }
50
51
/**
52
* 将待插入的关键字key插入哈希表
53
* 先调用查找算法,若在表中找到待插入的关键字,则插入失败;
54
* 若在表中找到一个开放地址,则将待插入的结点插入到其中,则插入成功。
55
*/
56
public
void insertHashTable(HashTable[] ha,
int p,
int size,
int key) {
57
int i = 1;
58
int addr = 0;
59 addr = key % p;
//
经过哈希函数获取哈希地址
60
if (ha[addr].key == NULLKEY || ha[addr].key == DELKEY) {
//
若是没有冲突,直接插入
61 ha[addr].key = key;
62 ha[addr].count = 1;
63 }
else {
//
若是有冲突,使用开放定址法处理冲突
64
do {
65 addr = (addr + 1) % size;
//
寻找下一个哈希地址
66 i++;
67 }
while (ha[addr].key != NULLKEY && ha[addr].key != DELKEY);
68
69 ha[addr].key = key;
70 ha[addr].count = i;
71 }
72 }
73
74
/**
75
* 建立哈希表
76
* 先将哈希表中各关键字清空,使其地址为开放的,而后调用插入算法将给定的关键字序列依次插入。
77
*/
78
public
void createHashTable(HashTable[] ha,
int[] list,
int p,
int size) {
79
int i = 0;
80
81
//
将哈希表中的全部关键字清空
82
for (i = 0; i < ha.length; i++) {
83 ha[i].key = NULLKEY;
84 ha[i].count = 0;
85 }
86
87
//
将关键字序列依次插入哈希表中
88
for (i = 0; i < list.length; i++) {
89
this.insertHashTable(ha, p, size, list[i]);
90 }
91 }
92
93
/**
94
* 输出哈希表
95
*/
96
public
void displayHashTable(HashTable[] ha) {
97
int i = 0;
98 System.out.format("pos:\t", "pos");
99
for (i = 0; i < ha.length; i++) {
100 System.out.format("%4d", i);
101 }
102 System.out.println();
103
104 System.out.format("key:\t");
105
for (i = 0; i < ha.length; i++) {
106
if (ha[i].key != NULLKEY) {
107 System.out.format("%4d", ha[i].key);
108 }
else {
109 System.out.format(" ");
110 }
111 }
112 System.out.println();
113
114 System.out.format("count:\t");
115
for (i = 0; i < ha.length; i++) {
116
if (0 != ha[i].count) {
117 System.out.format("%4d", ha[i].count);
118 }
else {
119 System.out.format(" ");
120 }
121 }
122 System.out.println();
123 }
124
125
public
static
void main(String[] args) {
126
int[] list = { 3, 112, 245, 27, 44, 19, 76, 29, 90 };
127 HashTable[] ha =
new HashTable[MAXSIZE];
128
for (
int i = 0; i < ha.length; i++) {
129 ha[i] =
new HashTable();
130 }
131
132 HashSearch search =
new HashSearch();
133 search.createHashTable(ha, list, 19, MAXSIZE);
134 search.displayHashTable(ha);
135
136 }
137
138 }
哈希查找之JAVA实现