[译]C语言实现一个简易的Hash table(4)

时间 2019-11-06

标签 c语言实现一个简易 hash table 繁體版

原文原文链接

上一章咱们解释了Hash table中最重要的hash函数，并用伪代码和C语言实现了一个咱们本身的hash函数，hash函数中碰撞是没法避免的，当发生碰撞时咱们改如何有效的处理呢？这章咱们就来说解下。算法

处理碰撞

hash函数中将无限大的输入映射到有限的输出中，当不一样的输入映射到相同的输出时，就会发生碰撞，每一个的hash表都会采用不一样的方法来处理碰撞。函数

咱们的哈希表将使用一种称为开放地址的双重哈希的技术来处理冲突。双重哈希使用两个散列函数来计算在发生碰撞后存储记录的索引。.net

双重哈希

当i发生碰撞后咱们使用以下方式来获取索引：3d

index = hash_a(string) + i * hash_b(string) % num_buckets

当没有发生碰撞时，i=0，因此索引就是hash_a的值，发生碰撞后，hash_a的结果就须要通过一次hash_b的处理。code

hash_b可能会返回0，将第二项减小到0，这就致使hash表会将多个记录插入到同一个bucket中，咱们能够在hash_b的结果后加1来处理这种状况，确保它永远不会为0：blog

index = (hash_a(string) + i * (hash_b(string) + 1)) % num_buckets

算法实现

// hash_table.c
static int ht_get_hash(const char* s, const int num_buckets, const int attempt) {
    const int hash_a = ht_hash(s, HT_PRIME_1, num_buckets);
    const int hash_b = ht_hash(s, HT_PRIME_2, num_buckets);
    return (hash_a + (attempt * (hash_b + 1))) % num_buckets;
}

上一章：hash函数下一章：完成Hash表API索引