排序

2020-08-31  本文已影响0人  贾里

[TOC]

初识排序

什么叫排序?

排序的应用无处不在

image.png image.png

10大排序算法

image.png

以上表格是基于数组进行排序的一般性结论

冒泡、选择、插入、归并、快速、希尔、堆排序,属于比较排序(Comparison Sorting)

冒泡排序(Bubble Sort)

冒泡排序也叫做起泡排序

执行流程(本课程统一以升序为例子)

原始实现

① 从头开始比较每一对相邻元素,如果第1个比第2个大,就交换它们的位置

② 忽略 ① 中曾经找到的最大元素,重复执行步骤 ①,直到全部元素有序

for (int end = array.length - 1; end > 0; end--) {
    for (int begin = 1; begin <= end; begin++) {
        if (array[begin] < array[begin - 1]) {
            int tmp = array[begin];
            array[begin] = array[begin - 1];
            array[begin - 1] = tmp;
        }
    }
}

冒泡排序 – 优化①

如果序列已经完全有序,可以提前终止冒泡排序

image.png
for (int end = array.length - 1; end > 0; end--) {
    boolean sorted = true;
    for (int begin = 1; begin <= end; begin++) {
        if (array[begin] < array[begin - 1]) {
            int tmp = array[begin];
            array[begin] = array[begin - 1];
            array[begin - 1] = tmp;
            sorted = false;
            }
        }
    if (sorted) break;
}

冒泡排序 – 优化②

如果序列尾部已经局部有序,可以记录最后1次交换的位置,减少比较次数

image.png

最后1次交换的位置是 6

for (int end = array.length - 1; end > 0; end--) {
    // sortedIndex的初始值在数组完全有序的时候有用
    int sortedIndex = 1;
    for (int begin = 1; begin <= end; begin++) {
        if (array[begin] < array[begin - 1]) {
            int tmp = array[begin];
            array[begin] = array[begin - 1];
            array[begin - 1] = tmp;
            sortedIndex = begin;
        }
    }
    end = sortedIndex;
}

复杂度分析

1.最坏、平均时间复杂度:O(n2)

2.最好时间复杂度:O(n)

3.空间复杂度:O(1)

排序算法的稳定性(Stability)

1.如果相等的2个元素,在排序前后的相对位置保持不变,那么这是稳定的排序算法

2.对自定义对象进行排序时,稳定性会影响最终的排序效果

3.冒泡排序属于稳定的排序算法

image.png

原地算法(In-place Algorithm)

何为原地算法?

非原地算法,称为 Not-in-place 或者 Out-of-place

冒泡排序属于 In-place

选择排序(Selection Sort)

执行流程

① 从序列中找出最大的那个元素,然后与最末尾的元素交换位置

② 忽略 ① 中曾经找到的最大元素,重复执行步骤 ①

for (int end = array.length - 1; end > 0; end--) {
        int maxIndex = 0;
        for (int begin = 1; begin <= end; begin++) {
            if (array[maxIndex] <= array[begin]) {
                    maxIndex = begin;
            }
        }
        int tmp = array[maxIndex];
        array[maxIndex] = array[end];
        array[end] = tmp;
}

复杂度分析

1.选择排序的交换次数要远远少于冒泡排序,平均性能优于冒泡排序

2.最好、最坏、平均时间复杂度:O(n2),空间复杂度:O(1),属于不稳定排序

思考

选择排序是否还有优化的空间?

堆排序(Heap Sort)

堆排序可以认为是对选择排序的一种优化

执行流程

① 对序列进行原地建堆(heapify)

② 重复执行以下操作,直到堆的元素数量为 1

✓交换堆顶元素与尾元素

✓堆的元素数量减 1

✓对 0 位置进行 1 次 siftDown 操

image.png

实现

public class HeapSort<T extends Comparable<T>> extends Sort<T> {
    private int heapSize;

    @Override
    protected void sort() {
        // 原地建堆
        heapSize = array.length;
        for (int i = (heapSize >> 1) - 1; i >= 0; i--) {
            siftDown(i);
        }
        
        while (heapSize > 1) {
            // 交换堆顶元素和尾部元素
            swap(0, --heapSize);

            // 对0位置进行siftDown(恢复堆的性质)
            siftDown(0);
        }
    }
    
    private void siftDown(int index) {
        T element = array[index];
        
        int half = heapSize >> 1;
        while (index < half) { // index必须是非叶子节点
            // 默认是左边跟父节点比
            int childIndex = (index << 1) + 1;
            T child = array[childIndex];
            
            int rightIndex = childIndex + 1;
            // 右子节点比左子节点大
            if (rightIndex < heapSize && 
                    cmp(array[rightIndex], child) > 0) { 
                child = array[childIndex = rightIndex];
            }
            
            // 大于等于子节点
            if (cmp(element, child) >= 0) break;
            
            array[index] = child;
            index = childIndex;
        }
        array[index] = element;
    }
}

复杂度分析

最好、最坏、平均时间复杂度:O(nlogn),空间复杂度:O(1),属于不稳定排序

泛型

稳定性


插入排序(Insertion Sort)

插入排序非常类似于扑克牌的排序

image.png

执行流程

① 在执行过程中,插入排序会将序列分为2部分

② 从头开始扫描每一个元素

image.png

实现

protected void sort() {
        for (int begin = 1; begin < array.length; begin++) {
            int cur = begin;
            while (cur > 0 && cmp(cur, cur - 1) < 0) {
                swap(cur, cur - 1);
                cur--;
            }
        }
    }

插入排序 – 逆序对(Inversion)

什么是逆序对?

插入排序的时间复杂度与逆序对的数量成正比关系

image.png

1.最坏、平均时间复杂度:O(n2)

2.最好时间复杂度:O(n)

3.空间复杂度:O(1)

4.属于稳定排序

5.当逆序对的数量极少时,插入排序的效率特别高

6.数据量不是特别大的时候,插入排序的效率也是非常好的

插入排序 – 优化

思路: 将【交换】转为【挪动

① 先将待插入的元素备份

② 头部有序数据中比待插入元素大的,都朝尾部方向挪动1个位置

③ 将待插入元素放到最终的合适位置

for (int begin = 1; begin < array.length; begin++) {
    int cur = begin;
    T v = array[cur];
    while (cur > 0 && cmp(v, array[cur - 1]) < 0) {
        array[cur] = array[cur - 1];
        cur--;
    }
    array[cur] = v;
}
image.png

二分搜索(Binary Search)

如何确定一个元素在数组中的位置?(假设数组里面全都是整数)

image.png

如果是有序数组,可以使用二分搜索,最坏时间复杂度:O(logn)

image.png

思路

image.png

例子

搜索10

image.png

搜索3

image.png

实现

/**
* 查找v在有序数组array中的位置
*/
public static int indexOf(int[] array, int v) {
    if (array == null || array.length == 0) return -1;
    int begin = 0;
    int end = array.length;
    while (begin < end) {
        int mid = (begin + end) >> 1;
        if (v < array[mid]) {
            end = mid;
        } else if (v > array[mid]) {
            begin = mid + 1;
        } else {
            return mid;
        }
    }
    return -1;
}

思考

如果存在多个重复的值,返回的是哪一个? ✓不确

插入排序-二分搜索优化

在元素 v 的插入过程中,可以先二分搜索出合适的插入位置,然后再将元素 v 插入

image.png

要求二分搜索返回的插入位置:第1个大于 v 的元素位置

二分搜索优化

思路

image.png image.png image.png image.png image.png
/**
* 查找v在有序数组array中待插入位置
*/
public static int search(int[] array, int v) {
    if (array == null || array.length == 0) return -1;
    int begin = 0;
    int end = array.length;
    while (begin < end) {
        int mid = (begin + end) >> 1;
        if (v < array[mid]) {
            end = mid;
        } else {
            begin = mid + 1;
        }
    }
    return begin;
}

插入排序-二分搜索优化-实现

protected void sort() {
    for (int begin = 1; begin < array.length; begin++) {
        insert(begin, search(begin));
    }
}
    
/**
* 将source位置的元素插入到dest位置
* @param source
* @param dest
*/
private void insert(int source, int dest) {
    T v = array[source];
    for (int i = source; i > dest; i--) {
        array[i] = array[i - 1];
    }
    array[dest] = v;
}
    
/**
* 利用二分搜索找到 index 位置元素的待插入位置
* 已经排好序数组的区间范围是 [0, index)
* @param index
* @return
*/
private int search(int index) {
    int begin = 0;
    int end = index;
    while (begin < end) {
        int mid = (begin + end) >> 1;
        if (cmp(array[index], array[mid]) < 0) {
            end = mid;
        } else {
            begin = mid + 1;
        }
    }
return begin;

需要注意的是,使用了二分搜索后,只是减少了比较次数,但插入排序的平均时间复杂度依然是 O(n2)

归并排序(Merge Sort)

1945年由约翰·冯·诺伊曼(John von Neumann)首次提出

image.png

执行流程

① 不断地将当前序列平均分割成2个子序列

② 不断地将2个子序列合并成一个有序序列

divide实现

    @Override
    protected void sort() {
        leftArray = (T[]) new Comparable[array.length >> 1];
        sort(0, array.length);
    }
    
    // T(n) = T(n/2) + T(n/2) + O(n)
    
    /**
     * 对 [begin, end) 范围的数据进行归并排序
     */
    private void sort(int begin, int end) {
        if (end - begin < 2) return;
        
        int mid = (begin + end) >> 1;
        sort(begin, mid);
        sort(mid, end);
        merge(begin, mid, end);
    }

merge

image.png

merge细节

需要 merge 的 2 组序列存在于同一个数组中,并且是挨在一起的

image.png

为了更好地完成 merge 操作,最好将其中 1 组序列备份出来,比如 [begin, mid)

image.png image.png image.png

merge – 左边先结束

image.png

merge – 右边先结束

image.png

merge实现

/**
     * 将 [begin, mid) 和 [mid, end) 范围的序列合并成一个有序序列
     */
    private void merge(int begin, int mid, int end) {
        int li = 0, le = mid - begin;
        int ri = mid, re = end;
        int ai = begin;
        
        // 备份左边数组
        for (int i = li; i < le; i++) {
            leftArray[i] = array[begin + i];
        }
        
        // 如果左边还没有结束
        while (li < le) { 
            if (ri < re && cmp(array[ri], leftArray[li]) < 0) {
                array[ai++] = array[ri++];
            } else {
                array[ai++] = leftArray[li++];
            }
        }
    }

复杂度分析

归并排序花费的时间

2.令S(n)= T(n)/n

3.由于归并排序总是平均分割子序列,所以最好、最坏、平均时间复杂度都是 O(nlogn) ,属于稳定排序

4.从代码中不难看出:归并排序的空间复杂度是 O(n/2+ logn) = O(n)

常见的递推式与复杂度

image.png

作业

合并两个有序数组

合并两个有序链表

合并K个有序链表

解题教程

快速排序(Quick Sort)

1960年由查尔斯·安东尼·理查德·霍尔(Charles Antony Richard Hoare,缩写为C. A. R. Hoare)提出

执行流程

① 从序列中选择一个轴点元素(pivot)

② 利用 pivot 将序列分割成 2 个子序列

③ 对子序列进行 ① ② 操作

image.png

快速排序的本质:逐渐将每一个元素都转换成轴点元素

轴点构造

image.png

时间复杂度

image.png

1.在轴点左右元素数量比较均匀的情况下,同时也是最好的情况

2.如果轴点左右元素数量极度不均匀,最坏情况

T(n) = T(n) − 1 + O(n) = O(n2)

3.为了降低最坏情况的出现概率,一般采取的做法是

4.最好、平均时间复杂度:O(nlogn)

5.最坏时间复杂度:O(n2)

6.由于递归调用的缘故,空间复杂度:O(logn)

7.属于不稳定排

实现

@Override
    protected void sort() {
        sort(0, array.length);
    }

    /**
     * 对 [begin, end) 范围的元素进行快速排序
     * @param begin
     * @param end
     */
    private void sort(int begin, int end) { 
        if (end - begin < 2) return;
        
        // 确定轴点位置 O(n)
        int mid = pivotIndex(begin, end);
        // 对子序列进行快速排序
        sort(begin, mid); 
        sort(mid + 1, end); 
    } 
    
    /**
     * 构造出 [begin, end) 范围的轴点元素
     * @return 轴点元素的最终位置
     */
    private int pivotIndex(int begin, int end) {
        // 随机选择一个元素跟begin位置进行交换
        swap(begin, begin + (int)(Math.random() * (end - begin)));
        
        // 备份begin位置的元素
        T pivot = array[begin];
        // end指向最后一个元素
        end--;
        
        while (begin < end) {
            while (begin < end) {
                if (cmp(pivot, array[end]) < 0) { // 右边元素 > 轴点元素
                    end--;
                } else { // 右边元素 <= 轴点元素
                    array[begin++] = array[end];
                    break;
                }
            }
            while (begin < end) {
                if (cmp(pivot, array[begin]) > 0) { // 左边元素 < 轴点元素
                    begin++;
                } else { // 左边元素 >= 轴点元素
                    array[end--] = array[begin];
                    break;
                }
            }
        }
        
        // 将轴点元素放入最终的位置
        array[begin] = pivot;
        // 返回轴点元素的位置
        return begin;
    }

与轴点相等的元素

image.png

如果序列中的所有元素都与轴点元素相等,利用目前的算法实现,轴点元素可以将序列分割成 2 个均匀的子序列

思考:cmp 位置的判断分别改为 ≤、≥ 会起到什么效果?

image.png

轴点元素分割出来的子序列极度不均匀

希尔排序(Shell Sort)

1959年由唐纳德·希尔(Donald Shell)提出

希尔排序把序列看作是一个矩阵,分成 𝑚 列,逐列进行排序

因此,希尔排序也被称为递减增量排序(Diminishing Increment Sort)

矩阵的列数取决于步长序列(step sequence)

希尔排序 – 实例

希尔本人给出的步长序列是 𝑛/2𝑘,比如 𝑛 为16时,步长序列是{1, 2, 4, 8}

image.png

分成8列进行排序


image.png

分成4列进行排序


image.png

分成2列进行排序


image.png

1列排序之后


image.png

不难看出来,从8列 变为 1列的过程中,逆序对的数量在逐渐减少

希尔排序的实例

假设有11个元素,步长序列是{1, 2, 5}

image.png

假设元素在第 col 列、第 row 行,步长(总列数)是 step

希尔排序 – 实现

protected void sort() {
    List<Integer> stepSequence = sedgewickStepSequence();
    for (Integer step : stepSequence) {
            sort(step);
    }
}
    
/**
* 分成step列进行排序
*/
private void sort(int step) {
    // col : 第几列,column的简称
    for (int col = 0; col < step; col++) { // 对第col列进行排序
        // col、col+step、col+2*step、col+3*step
        for (int begin = col + step; begin < array.length; begin += step) {
            int cur = begin;
            while (cur > col && cmp(cur, cur - step) < 0) {
                swap(cur, cur - step);
                cur -= step;
            }
        }
    }
}

/**
*获取步长
*/
private List<Integer> shellStepSequence() {
    List<Integer> stepSequence = new ArrayList<>();
    int step = array.length;
    while ((step >>= 1) > 0) {
        stepSequence.add(step);
    }       
    return stepSequence;
}

最好情况是步长序列只有1,且序列几乎有序,时间复杂度为 O(n)

希尔排序 – 步长序列

image.png
private List<Integer> sedgewickStepSequence() {
    List<Integer> stepSequence = new LinkedList<>();
    int k = 0, step = 0;
    while (true) {
        if (k % 2 == 0) {
            int pow = (int) Math.pow(2, k >> 1);
            step = 1 + 9 * (pow * pow - pow);
        } else {
            int pow1 = (int) Math.pow(2, (k - 1) >> 1);
            int pow2 = (int) Math.pow(2, (k + 1) >> 1);
            step = 1 + 8 * pow1 * pow2 - 6 * pow2;
        }
        if (step >= array.length) break;
        stepSequence.add(0, step);
        k++;
    }
    return stepSequence;
}

计数排序(Counting Sort)

1.之前学习的冒泡、选择、插入、归并、快速、希尔、堆排序,都是基于比较的排序

2.计数排序、桶排序、基数排序,都不是基于比较的排序

3.计数排序于1954年由Harold H. Seward提出,适合对一定范围内的整数进行排序

4.计数排序的核心思想

最简单的实现

image.png
protected void sort() {
        // 找出最大值
        int max = array[0];
        for (int i = 1; i < array.length; i++) {
            if (array[i] > max) {
                max = array[i];
            }
        } // O(n)
        
        // 开辟内存空间,存储每个整数出现的次数
        int[] counts = new int[1 + max];
        // 统计每个整数出现的次数
        for (int i = 0; i < array.length; i++) {
            counts[array[i]]++;
        } // O(n)
        
        // 根据整数的出现次数,对整数进行排序
        int index = 0;
        for (int i = 0; i < counts.length; i++) {
            while (counts[i]-- > 0) {
                array[index++] = i;
            }
        } // O(n)
    }   

这个版本的实现存在以下问题

改进思路

image.png

1.假设array中的最小值是 min

2.array中的元素 k 对应的 counts 索引是 k – min

3.array中的元素 k 在有序序列中的索引

4.比如元素 8 在有序序列中的索引

5.倒数第 1 个元素 7 在有序序列中的索引

6.倒数第 2 个元素 7 在有序序列中的索引

改进实现

image.png image.png image.png image.png image.png
protected void sort() {
        // 找出最值
        int max = array[0];
        int min = array[0];
        for (int i = 1; i < array.length; i++) {
            if (array[i] > max) {
                max = array[i];
            }
            if (array[i] < min) {
                min = array[i];
            }
        }
        
        // 开辟内存空间,存储次数
        int[] counts = new int[max - min + 1];
        // 统计每个整数出现的次数
        for (int i = 0; i < array.length; i++) {
            counts[array[i] - min]++;
        }
        // 累加次数
        for (int i = 1; i < counts.length; i++) {
            counts[i] += counts[i - 1];
        }
        
        // 从后往前遍历元素,将它放到有序数组中的合适位置
        int[] newArray = new int[array.length];
        for (int i = array.length - 1; i >= 0; i--) {
            newArray[--counts[array[i] - min]] = array[i];
        }
        
        // 将有序数组赋值到array
        for (int i = 0; i < newArray.length; i++) {
            array[i] = newArray[i];
        }
    }

复杂度分析

最好、最坏、平均时间复杂度:O(n + k) ◼ 空间复杂度:O(n + k)
◼ k 是整数的取值范围
◼ 属于稳定排序

对自定义对象进行排序

如果自定义对象可以提供用以排序的整数类型,依然可以使用计数排序

public void sort() {
        Person[] persons = new Person[] {
                new Person(20, "A"),
                new Person(-13, "B"),
                new Person(17, "C"),
                new Person(12, "D"),
                new Person(-13, "E"),
                new Person(20, "F")
        };
        
        // 找出最值
        int max = persons[0].age;
        int min = persons[0].age;
        for (int i = 1; i < persons.length; i++) {
            if (persons[i].age > max) {
                max = persons[i].age;
            }
            if (persons[i].age < min) {
                min = persons[i].age;
            }
        }
        
        // 开辟内存空间,存储次数
        int[] counts = new int[max - min + 1];
        // 统计每个整数出现的次数
        for (int i = 0; i < persons.length; i++) {
            counts[persons[i].age - min]++;
        }
        // 累加次数
        for (int i = 1; i < counts.length; i++) {
            counts[i] += counts[i - 1];
        }
        
        // 从后往前遍历元素,将它放到有序数组中的合适位置
        Person[] newArray = new Person[persons.length];
        for (int i = persons.length - 1; i >= 0; i--) {
            newArray[--counts[persons[i].age - min]] = persons[i];
        }
        
        // 将有序数组赋值到array
        for (int i = 0; i < newArray.length; i++) {
            persons[i] = newArray[i];
        }
        
        for (int i = 0; i < persons.length; i++) {
            System.out.println(persons[i]);
        }
    }
    
    private  class Person {
        int age;
        String name;
        Person(int age, String name) {
            this.age = age;
            this.name = name;
        }
        @Override
        public String toString() {
            return "Person [age=" + age 
                    + ", name=" + name + "]";
        }
    }

排序之后的结果

① Person [age=-13, name=B]

② Person [age=-13, name=E]

③ Person [age=12, name=D]

④ Person [age=17, name=C]

⑤ Person [age=20, name=A]

⑥ Person [age=20, name=F]

基数排序(Radix Sort)

◼ 基数排序非常适合用于整数排序(尤其是非负整数),因此本课程只演示对非负整数进行基数排序

◼ 执行流程:依次对个位数、十位数、百位数、千位数、万位数...进行排序(从低位到高位)

个位数、十位数、百位数的取值范围都是固定的0~9,可以使用计数排序对它们进行排序
◼ 思考:如果先对高位排序,再对低位排序,是否可行?

实现

另一种思路

桶排序(Bucket Sort)

上一篇下一篇

猜你喜欢

热点阅读