算法简单学习

算法简单学习(八)—— 堆排序

2017-08-18  本文已影响65人  刀客传奇

版本记录

版本号 时间
V1.0 2017.08.16

前言

将数据结构和算法比作计算机的基石毫不为过,追求程序的高效是每一个软件工程师的梦想。下面就是我对算法方面的基础知识理论与实践的总结。感兴趣的可以看上面几篇。
1. 算法简单学习(一)—— 前言
2. 算法简单学习(二)—— 一个简单的插入排序
3. 算法简单学习(三)—— 分治法与合并排序
4. 算法简单学习(四)—— 冒泡排序
5. 算法简单学习(五)—— 函数的增长
6. 算法简单学习(六)—— 常用的几种相关函数
7. 算法简单学习(七)—— 递归式

简单介绍堆排序 - heapsort

堆排序也是我们常用的一种算法,它像合并排序不像插入排序,堆排序的运行时间为O(nlgn),它是一种原地(in place)排序算法,在任何时候,数组中只有常数个元素存储在输入数组外。


二叉堆数据结构是一种数组现象,如下图所示。树中的每个节点与数组中存放该节点值的那个元素对应。

二叉堆数据结构

上面这个数据结构可以这么理解:

这里父子节点满足下面的关系。

父子节点关系

这里节点的 2i2i + 1 都可以通过二进制的移位获取。

二叉堆有两种:最大堆和最小堆,在最大堆中,最大堆特性是指除了根以外的每个节点i,都有:

A[PARENT(i)] ≥ A[i]

即某个节点的值至多是和其父节点的值一样大,这样堆中的最大元素就存放在根节点中,在以某一个结点为根的子树中,各结点的值都不大于该子树根节点的值。

最小堆则刚好相反,最小堆特性是指除了根以外的每个结点i,都有:

A[PARENT(i)] ≤ A[i]

也就是说最小堆的最小元素是在根部的,在堆排序算法中,我们使用的是最大堆,最小堆一般是在构造优先队列时使用。

具有n个元素的堆是基于一棵完全二叉树的,高度为Θ(lgn)。下面出五个基本过程,并说明他们在排序算法和优先级队列数据结构中如何使用。


堆性质的保持

MAX - HEAPIFY是对最大堆进行操作的重要的子程序,其输入为一个数组A和下标i。

下面看一下伪代码。

伪代码

下面看一下详细的过程。

堆树

heap - size[A] = 10时,MAX - HEAPIFY (A, 2)的作用过程如下:


MAX - HEAPIFY运行时间

下面我们就看一下运行时间。

MAX - HEAPIFY作用在一棵以结点i为根的,大小为n的子树上时,其运行时间为调整元素A[ i ]、A[LEFT( i )]和A[RIGHT( i )]的关系所用时间Θ(1),再加上对以i的某个结点为根的子树递归调用MAX - HEAPIFY所需的时间,i结点的子树大小最多为2n / 3,最坏情况就是最底层恰好半满的时候,下面看一下表达式:

T( n ) ≤ T(2 n / 3) + Θ(1)

这个递归式的解为 T( n ) = O(lgn),或者说MAX - HEAPIFY作用于一个高度为h的结点所需运行时间为O(h)

后记

未完,待续~~~

秋天
上一篇下一篇

猜你喜欢

热点阅读