第四章 分治策略
本章介绍分治法,首先通过前两节最大子数组、矩阵乘法两个问题说明分治法的一般步骤:分解,解决,合并。当子问题需要递归求解时称为递归情况,足够小可直接得出解为基本情况,其余一些与原问题不同子问题看做合并步骤部分。
然后介绍三种递归式的解法:代入法、递归树法和主方法。
- 代入法:猜测算法的复杂度界,用数学归纳法证明正确性。
- 递归树法:将递归式转换为树,结点表示不同层次的递归调用产生的代价。然后采用边界和技术求解。
- 主方法:求解如下递归式的界
一般忽略递归式声明、求解的技术细节和向下、向上取整及边界条件。
4.1 最大子数组问题
问题描述:一个记录每天股票价格的数组,寻找一段日期,使得从第一天到最后一天股票价格净变值最大。
分析:第一个想法:最低价格买进,最高价格卖出时收益最大,但是最高价可能比在最低价更早出现。那么最低价格买进或者最高价格卖出呢?即:
- 寻找最高和最低价格
- 从最高价开始向左寻找之前的最低价;从最低价开始向右寻找之前的最高价。
- 取两对价格中差值最大者。
说明有时最大收益既不是在最低价时买进,也不是最高价卖出。
暴力法:尝试每对可能的买进、卖出的日期组合,Ω(n^2)的复杂度。
问题变换
不从每日价格的角度看待输入,而是考察每日价格变化,即当天和前一天的价格差。原输入数组变为:
那么问题转化为寻找A的和最大的非空连续子数组——最大子数组。使用分治法求解
首先将原问题分解为一些规模相近的子问题,即将原数组分两半分别求解。A 的任何连续子数组的位置必然是以下情况:
故可以递归求解前两个,然后寻找跨中点的最大子数组,最后三者中取最大。找跨中点的最大子数组可在线性时间内完成:找出A[i ... mid] 和 A[mid + 1 ... j]的最大子数组然后合并。与原问题不同在于:此子数组必须包含A[mid]。
伪代码:
所以最大子数组问题分治算法伪代码为:
C++实现:
int a[20] = {0, 13,-3,-25,20,-3,-16,-23,18,20,-7,12,-5,-22,15,-4,7};
struct node
{
int mxl, mxr, sum;
};
node CrossSum(int a[], int low, int mid, int high)
{
int i, j, sum, maxl, maxr;
int leftsum = -INF;
sum = 0;
for (i = mid; i >= low; i --)//从中间向前遍历,故一定选中a[mid]
{
sum += a[i];
if(sum > leftsum)
{
leftsum = sum;
maxl = i;
}
}
int rightsum = -INF;
sum = 0;
for (j = mid + 1; j <= high; j ++)//从中间向后遍历
{
sum += a[j];
if(sum > rightsum)
{
rightsum = sum;
maxr = j;
}
}
node x;
x.sum = leftsum + rightsum; //左右最大值之和
x.mxl = maxl;
x.mxr = maxr;
//printf("insub %d %d %d\n", x.mxl, x.mxr, x.sum);
return x;
}
node FindMaxSub(int a[], int low, int high)
{
node x, y, z;
int i , j, mid;
if (low == high)
{
x.mxl = low;
x.mxr = high;
x.sum = a[low];
return x;
}
mid = (low + high) / 2;
//printf("mid = %d\n", mid);
x = FindMaxSub(a, low, mid);
y = FindMaxSub(a, mid + 1, high);
z = CrossSum(a, low, mid, high);
//printf("l = %d %d %d\n", x.mxl, x.mxr, x.sum);
//printf("r = %d %d %d\n", y.mxl, y.mxr, y.sum);
//printf("cro = %d %d %d\n", z.mxl, z.mxr, z.sum);
if (x.sum >= y.sum && x.sum >= z.sum)
return x;
else if (y.sum >= x.sum && y.sum >= z.sum)
return y;
else if (z.sum >= y.sum && z.sum >= x.sum)
return z;
}
分治算法的分析
建立以上算法的递归式。首先第一行基本情况T(1) = Θ(1)。n > 1时递归情况分两半每份T(n/2),共2 * T(n/2)。6~11行子函数Θ(n),其余Θ(1)。故此部分共2*T(n/2) + Θ(n)。得到递归式:与归并排序的一样,故也为Θ(nlgn)。
练习
4.1-1
答:返回A中最大的单个元素max(A[i])
4.1-2
伪代码:
FIND-MAX-SUBARRAY(A, low, high)
left = 0
right = 0
sum = -∞
for i = low to high
current-sum = 0
for j = i to high
current-sum += A[j]
if sum < current-sum
sum = current-sum
left = i
right = j
return (left, right, sum)
4.1-3
暴力算法C++实现:
node FindMaxSub(int a[], int low, int high)
{
int i, j, right = 0, left = 0;
int sum = -INF;
for (i = low; i <= high; i ++)
{
int curs = 0;
for ( j = i; j <= high; j++)
{
curs += a[j];
if (sum < curs)
{
sum = curs;
left = i;
right = j;
}
}
}
node x;
x.sum = sum;
x.mxl = left;
x.mxr = right;
return x;
}
暴力法 T(n) = a * n^2, 递归法 R(n) = b * nlgn,比较可得交叉点。改后不会变,相当于合并图像时取两段较低的部分。
4.1-4
答:每次返回子数组之前判断和是否小于0,若是则返回sum = 0。
4.1-5
答:用动态规划的思想实现。若当前和小于0则置0重新计算。C++代码:
node FindMaxSub(int a[], int low, int high)
{
int i, j, right = 0, left = 0;
int sum = -INF, curs = 0;
for (i = low; i <= high; i ++)
{
curs += a[i];
if (curs > sum)
{
sum = curs;
right = i;
}
if (curs < 0)
{
curs = 0;
left = i + 1;
}
}
node x;
x.sum = sum;
x.mxl = left;
x.mxr = right;
return x;
}
4.2 矩阵乘法的Strassen算法
矩阵乘法公式为: 需要计算n^2个元素,每个元素是 n 个数的和。根据公式伪代码: 先遍历每行,再遍历每列,对每个元素按公式计算求和。复杂度 Θ(n ^3)。简单分治法
将每个矩阵分四份 根据矩阵公式有 按此设计的分治算法伪代码:第五行分解矩阵若创建12个新矩阵将花费Θ(n ^2)。通过原矩阵的一组行、列下标指定子矩阵可以不用复制,故第五行可在Θ(1)内实现。
- n = 1时 T(1) = Θ(1)
- n > 1时 为递归情况,共8 次递归调用,每次完成两个n/2 * n/2的子矩阵乘法时间 8T(n/2), 矩阵加法总时间Θ(n ^2)。总时间
解出来实际上还是复杂度 Θ(n ^3)。
Strassen方法
核心思想是让递归树不那么茂盛,递归调用减为7次。步骤为: 递归式: 用主方法得到复杂度为Θ(n ^lg7)。4.3 用代入法求解递归式
代入法求解分两步:
- 猜测解的形式
- 用数学归纳法求出解中的常数,并证明正确性。
例:确定下式上界
猜测为O(n lg n),证明对于c > 0有T(n) <= c * nlgn。假定对所有证书m < n成立,m = floor(n/2)时,带入猜测式:扩展边界条件使归纳假设对较小的n成立。至于好的猜测,可通过递归树总结,或者先证明递归式较松的上下界,然后缩小不确定范围。一些技巧:
- 归纳假设不够强,无法证出准确的界时,可以试着从先前的猜测减去一个低阶项。
- 改变变量,函数整体替换。
练习
4.3-1
答:猜测T(n) <= cn^2 则4.3-2
4.3-3
4.4 用递归树解递归式
画出递归树是做出好的猜测的简单直接方法。在递归树中,每个结点代表一个单一子问题的代价。将树中每层代价求和,将所有层次代价求和得到递归调用总代价。
4.5 用主方法求解递归式
主方法为如下的递归式提供了“菜谱”式的求解方法。 主定理: 对于递归式则不能用,因为f(n)并不是多项式意义上的大于,递归式在情况2~3之间。