插入排序(二)
希尔排序
希尔排序的实质就是分组插入排序, 该方法又称缩小增量排序,因 DL. Shell于 1959 年提出而得名。
基本思想:先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下(接近最好情况),效率是很高的,因此希尔排序在时间效率上比前两种方法有较大提高。
具体算法描述:
以 n=10 的一个数组 49, 38, 65, 97, 26, 13, 27, 49, 55, 4 为例:
第一次 gap = 10 / 2 = 5
1A,1B, 2A,2B 等为分组标记,数字相同的表示在同一组,大写字母表示是该组的第几个元素, 每次对同一组的数据进行直接插入排序。即分成了五组(49, 13) (38, 27) (65, 49) (97, 55)(26, 4)这样每组排序后就变成了(13, 49) (27, 38) (49, 65) (55, 97) (4, 26),下同。
第二次 gap = 5 / 2 = 2
第三次 gap = 2 / 2 = 1
第三次分组
第四次 gap = 1 / 2 = 0 排序完成得到数组:
第四次分组
代码实现:
public static void shellsort1(int a[], int n){
int i, j, gap;
//步长
for (gap = n / 2; gap > 0; gap /= 2) {
//按组排序
for (i = 0; i < gap; i++) {
for (j = i + gap; j < n; j += gap) {
if (a[j] < a[j - gap]) {
int temp = a[j];
int k = j - gap;
while (k >= 0 && a[k] > temp) {
a[k + gap] = a[k];
k -= gap;
}
a[k + gap] = temp;
}
}
}
}
}
原来是每次从1A到1E,从2A到2E,可以改成从1B开始,先和1A比较,然后取2B与2A比较,再取1C与前面自己组内的数据比较…….。这种每次从数组第gap个元素开始,每个元素与自己组内的数据进行直接插入排序显然也是正确的。实现代码如下:
public static void shellsort2(int a[], int n)
{
int j, gap;
for (gap = n / 2; gap > 0; gap /= 2)
//从数组第gap个元素开始
for (j = gap; j < n; j++)
//每个元素与自己组内的数据进行直接插入排序
if (a[j] < a[j - gap]) {
int temp = a[j];
int k = j - gap;
while (k >= 0 && a[k] > temp) {
a[k + gap] = a[k];
k -= gap;
}
a[k + gap] = temp;
}
}
将直接插入排序部分改为上面直接排序的第三种写法,这样代码就十分简洁了:
public static void shellsort3(int a[], int n)
{
int i, j, gap;
for (gap = n / 2; gap > 0; gap /= 2)
for (i = gap; i < n; i++)
for (j = i - gap; j >= 0 && a[j] > a[j + gap]; j -= gap)
Swap.swap(a,j, j + gap);
}
直接插入排序在数据量少或者序列基本有序的情况下,效率比较高。如果一开始就进行直接插入排序,此时整个序列不是基本有效的,而且遇到数据量大时,效率也不高。而上面介绍的希尔排序,就是先进行拆分,对拆分后的小序列进行基本插入排序,在最后一次进行直接插入排序的时候,整个大的序列已经基本有序了。所以最后一次直接插入排序的效率应该是很高的。希尔排序的关键是将相隔某个增量的数组成一个序列,进行直接插入排序,最以此来提高排序的效率。那么如何选取这个增量,是一个比较关键的问题,不过不管增量如何取值,有一点是固定的,就是增量的最后一个值一定要是1,这样才能保证整个序列最后是有序的。