科普跳跃表-SkipList

2017-12-18 本文已影响24人刘振锋

什么是跳表

跳表是一种有序的数据结构，它通过在每个节点中维持多个指向其它节点的指针，从而达到快速访问的目的。

核心思想

image.png

这是一个单向链表，我们要查询链表中某个元素的话，需要遍历整条链，所以链表查询的时间复杂度为O(N)。

O(N)，这个时间复杂度比较高，查询效率较低，于是就有人试图优化。

其中，William Pugh 受到二分查找的启发，就思考能不能通过二分法来跳过部分节点，直接锁定目标。于是，他做出了这样的假设。

如果是说链表是排序的，并且节点中还存储了指向前面第二个节点的指针的话，那么在查找一个节点时，仅仅需要遍历N/2个节点即可。

image.png

同理，如果节点中还存储指向前面第四个节点的指针的话，那么查找下一个节点时，仅仅需要遍历N/4个节点。

image.png
这就是跳表的核心思想，通过一个“空间来换取时间”的算法，通过在每个节点中增加了向前的指针，从而提升查找的效率，显然，它的查找时间复杂度为O(logN)。

其实，这只是理想状态下的跳表。

在这种理想状态下，每次插入或者删除节点时，新节点前面的所有节点都要重新关联，这显然不是我们想要的结果。

现实中的跳表是这样的。

image.png

跳表的性质

(1) 由很多层结构组成

(2) 每一层都是一个有序的链表

(3) 最底层(Level 1)的链表包含所有元素

(4) 如果一个元素出现在 Level i 的链表中，则它在 Level i 之下的链表也都会出现。

跳表的结构

跳跃表的节点有三部分构成：key值，value值，以及指向前向节点的指针数组，指针数组的大小由该节点的层数决定。

image.png

所以，节点的数据类型可以定义为

typedef struct nodeStructure {
    keyType key; // key值
    valueType value;  // value值
    node forward[1];  // 向前指针数组，根据该节点层数的不同指向不同大小的数组
};

定义跳表数据类型：

typedef struct listStructure {
   int level; // 跳表的层数
   struct nodeStructure * header; // 指向header节点的指针
   } * list;

跳表的操作

查询

对于下图这个链表结构，假设我们要查询值为56的节点，我们需要比较10次。

image.png

使用跳表优化过的查询算法，我们只需要比较3次。

image.png

插入

同链表类似。

删除

同链表类似。

性能对比

我们对跳跃表、平衡树等进行比较，如下图()所示：

图片来自网络，未找到原出处

科普跳跃表-SkipList

什么是跳表

核心思想

跳表的性质

跳表的结构

跳表的操作

查询

插入

删除

性能对比

猜你喜欢

热点阅读