最近我在作一个项目,其中要用到一个数据结构——Hash Table(哈希表),之前只有理论知识,如今实却发现很不简单,因此写下来和你们共分享。
咱们知道,哈希表是一个固定大小的数组,数组的每一个元素是一个链表(单向或双向)的头指针。若是Key同样,则在一块儿,若是Key不同,则不在一块儿。哈希表的查询是飞快的。由于它不须要从头搜索,它利用Key的“哈希算法”直接定位,查找很是快,各类数据库中的数据结构基本都是它。但带来的问题是,哈希表的尺寸、哈希算法。
哈希表的数组是定长的,若是太大,则浪费,若是过小,体现不出效率。合适的数组大小是哈希表的性能的关键。哈希表的尺寸最好是一个质数,最小的质数尺寸是17。
固然,根据不一样的数据量,会有不一样的哈希表的大小。对于数据量很时多时少的应用,最好的设计是使用动态可变尺寸的哈希表,那么若是你发现哈希表尺寸过小了,好比其中的元素是哈希表尺寸的2倍时,咱们就须要扩大哈希表尺寸,通常是扩大一倍。下面的数库是哈希表变化尺寸时尺寸大小的一个列表。
static int prime_array[] = {
17, /* 0 */
37, /* 1 */
79, /* 2 */
163, /* 3 */
331, /* 4 */
673, /* 5 */
1361, /* 6 */
2729, /* 7 */
5471, /* 8 */
10949, /* 9 */
21911, /* 10 */
43853, /* 11 */
87719, /* 12 */
175447, /* 13 */
350899, /* 14 */
701819, /* 15 */
1403641, /* 16 */
2807303, /* 17 */
5614657, /* 18 */
11229331, /* 19 */
22458671, /* 20 */
44917381, /* 21 */
89834777, /* 22 */
179669557, /* 23 */
359339171, /* 24 */
718678369, /* 25 */
1437356741, /* 26 */
2147483647 /* 27 (largest signed int prime) */
};
#define PRIME_ARRAY_SIZE (28)
要使用哈希表,就必定要用一个哈希算法,来肯定KEY值,这彷佛是个很难的事,下面是一个哈希算法:
typedef struct _hTab{
hLinks* link; /* 一个链表 */
int num; /* 成员个数 */
int size; /* 表的尺寸 */
} hTab;
static unsigned int
getHashIndex(hTab *tabPtr, const char *key)
{
unsigned int ha = 0;
while (*key)
ha = (ha * 128 + *key++) % tabPtr->size;
return ha;
}
(其中key是一个字符串,hTab就是一个哈希表结构, tabPtr->size是哈希表数组的大小)
———— (版权全部,如需转载,请注明出处及做者)