程序猿必修课之数据结构（二）算法和算法的复杂度

2017-03-31 本文已影响2560人 Xiao_Mai

原文出自：http://www.jianshu.com/p/d72d4c9e90c6

上一章：程序猿必修课之数据结构（一）数据结构基本概念和术语

算法

算法是解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。

算法的特性

算法具有五个基本特性：输入、输出、有穷性、确定性、可行性。

算法设计的要求

好的算法，应该具有：正确性、可读性、健壮性、高效率和低存储量的特征。

函数的渐近增长

输入规模 n 在没有限制的情况下，只要超过一个数值 N，这个函数就总是大于另一个函数，我们称函数是渐近增长的。

给定两个函数 f(n) 和 g(n), 如果存在一个整数 N，使得对于所有的 n > N, f(n) 总是比 g(n) 大，那么我们说 f(n) 的增长渐近快于 g(n)。

算法时间复杂度

在进行算法分析时，语句总的执行次数 T(n) 是关于问题规模 n 的函数，进而分析 T(n) 随 n 的变化情况并确定 T(n) 的数量级。算法的时间复杂度，也就是算法的时间量度，记作：T(n) = O(f(n))。它表示随问题规模 n 的增大，算法执行时间的增长率和 f(n) 的增长率相同，称为算法的渐近时间复杂度，简称为时间复杂度。其中 f(n) 是规模 n 的某个函数。

用 O() 来体现算法时间复杂度的记法，叫作大 O 记法。

推导大 O 阶方法

用常数 1 取代运行时间中的所有加法常数。
在修改后的运行次数函数中，只保留最高阶项。
如果最高阶项存在且不是 1 ，则去除与这个项相乘的常数。

常数阶

高斯算法

int sum = 0, n = 100;   // 执行 1 次
sum = (1 + n) * n / 2;  // 执行 1 次
printf("%d", sum);      // 执行 1 次

这个算法的运行次数函数是 f(n) = 3。根据推导大 O 阶的方法，第一步把常数项 3 改为 1。第二步保留最高阶项，它没有最高阶项，所以这个算法的时间复杂度为 T(n) = O(1)。

当 n = 1 时，算法执行次数为 3，当 n = 100时，算法的执行次数还是 3，所以我们可以看出这个算法的执行次数与 n 的规模没关系。我们把这种与问题的大小（n 的大小）无关，执行时间恒定的算法，叫作常数阶。

对于分支结构，无论是真还是假，执行的次数都是恒定的，不会随着 n 的变化而变化，所以单纯的分支结构（不包含在循环结构中），其时间复杂度也是 O(1)。

线性阶

下面这段代码的时间复杂度为 O(n),因为循环体中的代码必须要执行 n 次。

int i;
for (i = 0; i < n; i++) {
    /* 时间复杂度为 O(1) 的程序步骤序列 */
}

对数阶

int count = 1;
while (count < n) {
    count = count * 2;
    /* 时间复杂度为 O(1) 的程序步骤序列 */
}

由于每次 count 乘以 2 以后，就越来越接近于 n，也就是说有多少个 2 相乘后大于 n，则会退出循环。由 2x = n 等到 x = log2n。所以这个算法的时间复杂度为 T(n) = O(logn)。

平方阶

这是一个循环嵌套的代码。

int i, j;
for (i = 0; i < n; i++) {
    for (j = 0; j < n; j++) {
        /* 时间复杂度为 O(1) 的程序步骤序列 */
    }
}

它的内循环我们已经知道，时间复杂度为 O(n)，而对于外层的循环，不过是内部这个时间复杂度为 O(n) 的语句，再循环 n 次。所以这段代码的时间复杂度为 O(n2)

如果外循环的次数改为了 m，时间复杂度就变为 O(m*n)。

int i, j， m;
for (i = 0; i < m; i++) {
    for (j = 0; j < n; j++) {
        /* 时间复杂度为 O(1) 的程序步骤序列 */
    }
}

所以我们可以总结得出，循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。

下面这个循环嵌套，它的时间复杂度是多少呢？

int i, j;
for (i = 0; i < n; i++) {
    for (j = i; j < n; j++) {   // 注意 j = i 而不是 0
        /* 时间复杂度为 O(1) 的程序步骤序列 */
    }
}

由于当 i = 0 时，内循环执行了 n 次，当 i = 1 时，执行了 n -1 次，…… 当 i = n - 1 时，执行了 1 次。所以部的执行次数为：

n + (n-1) + (n-2) + …… + 1 = n(n+1)/2 = n2/2 + n/2。

用我们推导大 O 阶的方法，第一条，没有加法常数不考虑；第二条，只保留最高阶项，因此保留 n2/2；第三条，去除这个项相乘的常数，也就是去除 1/2，最终这个算法的时间复杂度为 T(n) = O(n2)

常见的时间复杂度

阶	非正式术语
O(1)	常数阶
O(n)	线性阶
O(n²)	平方阶
O(logn)	对数阶
O(nlogn)	nlogn阶
O(n³)	立方阶
O(2ⁿ)	指数阶

常用的时间复杂度所耗费的时间从小到大依次是：

O(1) < O(logn) < O(n) < O(nlogn) < O(n²) < O(n³) < O(2ⁿ) < O(n!) < O(nⁿ)

算法空间复杂度

算法的空间复杂度通过计算算法所需的存储空间实现，算法空间复杂度的计算公式：S(n) = O(f(n)),其中 n 为问题的规模，f(n)为语句关于 n 所占存储空间的函数。

总结

算法是解决特定问题求解步骤的描述，在计算机中为指令的有限序列，并且每条指令表示一个或多个操作。
算法的特性：有穷性、确定性、可行性、输入、输出。
算法的设计要求：正确性、可读性、健壮性、高效率和低存储量需求。

下一章：程序猿必修课之数据结构（三）线性表1