小白学编程

[译]C语言实现一个简易的Hash table(7)

2019-02-03  本文已影响1人  正义的程序员

上一章我们讲了如何根据需要动态设置hash表的大小,在第四章中,我们使用了双重哈希来解决hash表的碰撞,其实解决方法有很多,这一章我们来介绍下其他方法。

本章将介绍两种解决hash表碰撞的方法:

  1. 拉链法
  2. 开放地址法

拉链法

使用拉链法,每一个bucket都会包含一个链接表,当发生碰撞时,就会将该记录插入在该位置的链接表后面,步骤如下:

拉链法的优点是实现起来简单,但是空间利用率低。每个记录必须存储指向链接表中下一个记录的指针,如果没有记录,则指向NULL,这种方法会浪费一些空间来存储额外的指针。

开放地址法

开放地址法能解决拉链法空间利用率低的问题,发生碰撞时,碰撞的记录将放置在hash表中的其他bucket中,存放的位置是根据预先确定的规则选择的,以便在搜索记录时可以重复该规则,有如下几种规则:

线性探查

当发生碰撞时,就会递增索引,将记录插入在下一个可用的索引中,方法如下:

线性探测提供了良好的缓存性能,但是存在碰撞后遍历次数多的问题。将发生碰撞key放入下一个可用的bucket中可能导致后面插入记录也要往后插,就需要多次迭代。

二次探查

二次探查法和先行探查类似,不同的是,发生碰撞后,我们会将记录插入在如下的序列中:i, i + 1, i + 4, i + 9, i + 16, ...i代表通过hash函数获取到的索引,具体步骤如下:

二次探查法减少发生碰撞后遍历的次数,并且仍然提供了不错的缓存性能。

双重hash

双重hash旨在解决碰撞后遍历次数多的问题。使用两次hash函数为插入的记录选择新的索引,这个索引会均匀的分布在整个表中,该方法虽然解决了上述问题,但也失去了缓存特性,双重hash是实际项目中常见的冲突管理方法,也是我们在本教程中实现的方法。

上一章:设置hash表大小


原文地址:https://github.com/jamesroutley/write-a-hash-table/tree/master/07-appendix

上一篇 下一篇

猜你喜欢

热点阅读