排序算法(七):快速排序
快速排序是通过分治的方式,根据选定元素将待排序集合拆分为两个值域的子集合,并对子集合递归拆分,当拆分后的每个子集合中元素个数为一时,自然就是有序状态。
归并排序也是基于分治的思想,不过归并流程是将子集合合并成为有序的集合,递归执行来完成整个集合的排序。快速排序的分治流程是根据选定元素,将集合分隔为两个子集合,一个子集合中所有元素不大于选定元素值,另一个子集合中所有元素不小于选定元素值,则用于拆分集合的选定元素即为已排序元素。即每次拆分都会形成一个已排序元素,所以 个元素的序列,拆分的次数级别为 。将拆分过程类比为二叉树形式,考虑普通二叉树和斜树的情况,则二叉树高度级别为 ~。
算法过程
- 在所有集合中均选定某一个元素;
- 根据选定元素,将每个集合拆分为元素值不大于该元素值的子集合,和元素值不小于该元素值的子集合;
- 重复步骤 1,2,直到每个集合中元素个数为 1。
演示示例
假设每个集合中的选定元素 为集合中的最后一个元素。
拆分过程
拆分过程也就是将集合中元素值不大于 的元素,和元素值不小于 的元素,通过交换元素位置的方式分别移动到 元素的两侧,这里不妨称之为正确区域。由此可知,在拆分过程中,若已将集合中所有小于 值的元素移动到正确区域中,则拆分过程完成。
如下示例中 、 元素值不小于 ,、和 元素值小于 。
在集合由左向右的遍历过程中,若当前元素值小于 值时,则将当前元素替换到正确区域中。所以在拆分过程中需要维持两个变量 和 ,分别指向当前遍历的元素位置,和正确区域尾部的下一个元素位置,或者称之为带加入正确区域的元素位置。
首次访问: ,,皆指向
此时正确区域为空,所以正确区域尾部的下一个元素位置也就是起始元素位置
因为 值小于 ,所以替换 和 指向的元素值(其实不用替换,就是同一个元素),移动 和 各自指向下一个元素位置。
第 2 次访问: ,,皆指向
此时正确区域元素为:[],所以正确区域尾部的下一个元素就是
元素值不小于 ,所以 指向下一个元素, 指向不变
第 3 次访问: ,指向 ,,指向
此时正确区域元素为:[],所以正确区域尾部的下一个元素就是
元素值不小于 ,所以 指向下一个元素, 指向不变
第 4 次访问: ,指向 ,,指向
此时正确区域元素为:[],所以正确区域尾部的下一个元素就是
元素值小于 ,所以替换 和 指向的元素值,移动 和 各自指向下一个元素位置。
第 5 次访问: ,指向 ,,指向
此时正确区域元素为:,所以正确区域尾部的下一个元素就是
元素值小于 ,所以替换 和 指向的元素值,移动 和 各自指向下一个元素位置。
第 6 次访问: ,指向 ,,指向
此时正确区域元素为:,所以正确区域尾部的下一个元素就是
因为访问到了集合尾部的选定元素,此时替换 和 指向的元素值,完成拆分过程。
此时可以发现,选定元素的左右两侧皆为正确区域,即左侧元素值都不大于 值,右侧元素值都不小于 值。所以下一轮进行拆分的则为 构成的集合和 构成的集合。
拆分过程存在一种现象,例如当前情况下是取集合的最后一个元素为选定元素进行拆分,若初始序列为有序状态,则每一次拆分后的两个集合,一个集合元素个数为 ,另一个集合为空,递归进行拆解时情况同样如此,也就是走势宛如斜树一般。
算法示例
def sort(arr, left, right):
if left < right:
divide = quickSort(arr, left, right) # the divide operation
sort(arr, left, divide - 1) # recursive sorting
sort(arr, divide + 1, right)
def quickSort(arr, left, right):
lessIndex, partitionValue = left, arr[right]
for i in range(left, right): #Traversing
if arr[i] < partitionValue:
arr[i], arr[lessIndex] = arr[lessIndex], arr[i]
lessIndex = lessIndex + 1
arr[lessIndex], arr[right] = partitionValue, arr[lessIndex]
return lessIndex
quickSort 操作中的循环用于遍历集合中元素,每一次遍历结束,可以形成两个正确区域,即不大于选定元素值的元素区域,和不小于选定元素值得元素区域。因为是直接根据位置进行替换,所以相比较于两两相邻元素比较替换效率要高许多,当然也导致了算法的不稳定性。
算法分析
快速排序是一种非稳定排序算法,形式上类似于归并排序,操作上刚好相反,一个是对集合先拆分后操作,一个是对集合先操作后拆分。对于 个元素的初始集合,因为在每个子集合的拆分过程中,都需要对集合进行遍历比较,所以若对 个元素的集合进行拆分,则比较次数级别为 ,平均交换次数为 ,即交换次数级别为 。因为拆分集合的过程存在普通二叉树和斜树的情况,所以树高为 ~,每一层的平均比较和交换复杂度为 ,所以累加可得快速排序的比较和交换复杂度为 ~ 。排序过程属于原地排序,不需要额外的存储空间,所以空间复杂度为 ~。