运筹学

LP问题进阶 Part 2 | 对偶理论

2019-07-05  本文已影响0人  StRygwyr

这一部分对应书上第七章(P45-P51),难度和第四章差不多。由于引用了一些非数学的概念,所以学习的时候难免会遇到一些看似无所根据的概念或者假设。建议大家不要在各种花里胡哨的假设上浪费时间,要把精力留给数学。
虽然线性规划的对偶理论在线性代数和数学模型中都没怎么被提到,但其理论本身有趣而且有用。对偶理论将原LP问题转化为其对偶LP问题,从而使与原问题相关的一些复杂的性质(如解是否为最优)变为对偶问题中较为简单的性质(对应地,解是否可行)
第五章和第六章暂时没有讲。 第五章主要是线性代数的内容,在此默认大家都学过。需要看一眼的是最后提到的用矩阵表示LP问题的方法。第六章是敏感性分析,我打算留到最后和算法复杂度一起讲。

为方便查阅,再link一下教材


基本概念

为方便理解我们引入一个例子:

例1: 现有一工厂可以生产小人偶和小火车这两种玩具。生产一个小人偶需要1单位木材和2单位颜料,产生3单位收益。生产一辆小火车需要1单位木材和1单位颜料,产生2单位收益。工厂现有80单位木材和100单位颜料,问如何分配火车与人偶的生产量可以使得收益最大?(见下图左侧)

为方便理解对偶性而引入的一个简单的例子

先补充几个前几章出现过但我没有提到的简单概念。由于没有了解过中文版教材所以翻译可能不太准确。

回忆上一次在基本概念中讲到的基本解与字典的概念,结合线性代数的知识,我们可以将LP问题写为:

LP问题的矩阵表示

不要被上图中复杂的形式迷惑,其实推导过程非常简单。式中各个符号的定义见教材第32页。需要强调的两点是:

目标函数的值(c_{B}B^{-1}b)和判断最优解的条件(c_{N} - c_{B}B^{-1}N < 0)这两个矩阵表示非常重要,建议各位同学自己推导一遍并记下来。

现在假设在市场上有以价格y_{1}y_{2}售卖的木材与颜料,如上图右侧所示。市场是一个很有趣的概念,可惜我不怎么懂,只知道本章许多内容都与之多多少少地相关。接下来介绍一个比较重要的概念。

影子价格c_{B}B^{-1}是一个向量,其每个元素对应一种材料。

基本概念大概就是这些,接下来就是神奇的部分了。


对偶性理论

这一部分有许多条件并不是一般的,比如我们只讨论了最大值问题而没研究最小值问题。不过方法的本质都是一样的。

1. 基本假设与直观理解

对偶(Dual)不论是单词还是翻译都和泛函分析中函数空间的那种对偶一样。事实上对偶是数学中一种非常常见的思想方法。通过配合地研究原问题(Primal)对偶问题(Dual)我们可以得到很多性质颇好的结论。首先,我们引入一个假设:

假设1: 生产一件产品所需的材料的价格不小于出售该件产品所带来的收益。

之后我们简称生产某件产品所需的材料的价格为该产品的材料成本。对于该假设我们可以作如下理解:

其实在思考本假设的意义时我也有很多疑问,当然可能我现在对于此问题的理解仍然是错误的。我们不妨先默认这些看似不合理直观的假设,推得我们想要的理论,之后再严谨地用数学方法证明理论的合理性即可。当然,感兴趣的同学也可以参考经济学领域的相关书籍。
不论如何,我们不应在直观理解上浪费太多时间。我们现在引出原问题对偶问题的形式:

原问题与对偶问题

左边为原问题,右边为对偶问题。首先可以注意到的是对偶问题的限制条件即假设1。此时有显然的关系式:3x_{1}+2x_{2} \leq (y_{1} + 2 y_{2})x_{1} + (y_{1} + y_{2})x_{2} = y_{1}(x_{1} + x_{2}) + y_{2}(2x_{1}+x_{2}) \leq 80y_{1} + 100y_{2}左边的不等号对应于对偶问题的限制条件,右边的不等号则对应原问题的对偶条件。因此两边目标函数存在关系:Max \ 3x_{1}+2x_{2} \leq Min \ 80y_{1} + 100y_{2}是显然的。这其实就是待会要提到的弱对偶性

原问题与对偶问题的矩阵表示如下图所示:

原问题与对偶问题的矩阵表示
由此可知对偶问题的对偶问题就是原问题。即两问题互为对偶

2. 弱对偶性与强对偶性定理

关于对偶性,最关键的理论就是以下两个重要的定理:

定理1 (弱对偶性) 假设xy分别是原问题与对偶问题的可行解,则:c^{T}x \leq b^{T}y证明:由限制条件可知:c^{T}x \leq (A^{T}y)^{T}x = (y^{T}A)x = y^{T}(Ax) \leq y^{T}b = b^{T}y证明完毕。

由弱对偶性可知:

定理2 (强对偶性) 假设xy分别是原问题与对偶问题的最优解,则:c^{T}x = b^{T}y 且满足y^{T}(b-Ax) = x^{T}(A^{T}y - c) = 0其中b-AxA^{T}y - c分别对应着原问题与对偶问题中的松弛变量。

我们现在还无法证明这个定理。

3. 原问题与对偶问题的性质

为了证明强对偶性定理并得到一些我们需要的性质,在此先叙述一些相对简单的概念与结论。由于原问题与对偶问题实际上互为对偶,故不失一般性地可以只叙述原问题的性质。

性质1: 原问题中每一个等号-限制条件都对应一个无符号限制的对偶变量。

此处“等号-限制条件”的含义应该是清晰的。原问题中的每一条限制条件都对应着一个对偶变量,这一点大家也需要牢记。强调以下几点:

接下来介绍互补松弛的概念。

定义1:称向量x = (x_{1}, \cdots , x_{n})y = (y_{1}, \cdots , y_{n})互补的(complementary),若:y^{T}(b-Ax) = x^{T}(A^{T}y - c) = 0

关于互补,有如下性质:

命题1:对于LP问题的任意基本解x,由其定义的影子价格\pi与之互补
证明:明天再说!

关于互补松弛性,有以下几点重要的性质。先不加证明地列出:

x是原问题的最优解,则

结合命题1可知:

x是原问题的基本可行解,\pi是其影子价格,则x为最优解当且仅当\pi是可行解。

如本文开头所言,判断最优性的问题被巧妙地转化为了判断可行性地问题。

上一篇 下一篇

猜你喜欢

热点阅读