C语言实现一个简易的Hash table(7)

时间 2019-12-05

标签 c语言实现一个简易 hash table 繁體版

原文原文链接

上一章咱们讲了如何根据须要动态设置hash表的大小，在第四章中，咱们使用了双重哈希来解决hash表的碰撞，其实解决方法有不少，这一章咱们来介绍下其余方法。segmentfault

本章将介绍两种解决hash表碰撞的方法：缓存

拉链法

使用拉链法，每个bucket都会包含一个连接表，当发生碰撞时，就会将该记录插入在该位置的连接表后面，步骤以下：函数

插入时：经过hash函数获取到要插入的位置，若是该位置是空的，就直接插入，若是该位置不是空的，就插入在连接表的后面
搜索时：经过hash函数获取到key对应的位置，遍历连接表，判断key是否是搜索的key，若是是，则返回value，不然返回NULL
删除时：经过hash函数获取到key对应的位置，遍历连接表，找到须要删除的key，若是找到，则将该key对应的记录从连接表中删除，若是连接表中只有一条记录，则将该位置置为NULL

拉链法的优势是实现起来简单，可是空间利用率低。每一个记录必须存储指向连接表中下一个记录的指针，若是没有记录，则指向NULL，这种方法会浪费一些空间来存储额外的指针。性能

开放地址法能解决拉链法空间利用率低的问题，发生碰撞时，碰撞的记录将放置在hash表中的其余bucket中，存放的位置是根据预先肯定的规则选择的，以便在搜索记录时能够重复该规则，有以下几种规则：spa

当发生碰撞时，就会递增索引，将记录插入在下一个可用的索引中，方法以下：指针

线性探测提供了良好的缓存性能，可是存在碰撞后遍历次数多的问题。将发生碰撞的key放入下一个可用的bucket中可能致使后面插入记录也要日后插，就须要屡次迭代。code

二次探查法和先行探查相似，不一样的是，发生碰撞后，咱们会将记录插入在以下的序列中：i, i + 1, i + 4, i + 9, i + 16, ...，i表明经过hash函数获取到的索引，具体步骤以下：教程

插入时：经过hash函数找到插入的索引，经过遍历上面的序列直到找到一个空的或已被删除的索引位置，执行插入
搜索时：经过hash函数找到key的索引，遍历上面的序列，将序列上的key与搜索的key对比，若是相等，则返回value，不然返回NULL
删除时：由于咱们没法判断要删除的项是否是碰撞链上的，因此咱们不能直接删除该条记录，只能把它标记为已删除

二次探查法减小发生碰撞后遍历的次数，而且仍然提供了不错的缓存性能。索引

双重hash旨在解决碰撞后遍历次数多的问题。使用两次hash函数为插入的记录选择新的索引，这个索引会均匀的分布在整个表中，该方法虽然解决了上述问题，但也失去了缓存特性，双重hash是实际项目中常见的冲突管理方法，也是咱们在本教程中实现的方法。get