TIP抽象的对偶来自共轭函数——Fenchel对偶,拉格朗日对偶是对偶理论的一种具体形式,而线性规划的对偶问题是拉格朗日对偶在特定约束条件下的一个特例。
拉格朗日对偶问题的定义#
回顾拉格朗日函数及其对偶函数和对偶问题,这里不过多赘述
线性规划的对偶问题#
LP对称形式的对偶问题定义如下:
LP:
maxzs.t.Axx=cTx≥b≥0DP
minfs.t.ATyy=bTy≤c≥0含义:为每种资源赋予一个单价 y(对偶变量),使得在保证“成本不低于收益”的前提下,总资源价值 bTy 最小。
如果LP是标准形式
LP:
maxzs.t.Axx=cTx=b≥0DP:(和上面DP的区别是y没有非负约束了)
minfs.t.ATy=bTy≤c
| 原问题 (Primal) | 对偶问题 (Dual) |
|---|
| 目标函数系数 c | 约束条件的右端向量 c |
| 约束条件的右端向量 b | 目标函数系数 b |
| 约束矩阵 A | 转置矩阵 AT |
| 变量 xj≥0 | 第 j 个约束为 ≥ 型 |
| 第 i 个约束为 ≤ 型 | 变量 yi≥0 |
| 目标函数 max | 目标函数 min |
TIP关于这个对偶是怎么来的
把LP统一成不等式约束为 g(x)≤0 的形式:Ax−b≤0,给目标函数 maxcTx 加个负号符合拉格朗日乘子法的最小化问题。构造拉格朗日函数:
L(x,y)=−cTx+yT(Ax−b)其中 y≥0 ,是拉格朗日乘子。对 x 取下确界,构造对偶函数
g(y)=xinfL(x,y)=xinf(−cTx+yT(Ax−b))=−yTb+xinf((−cT+yTA)x)求inf:如果 −cT+yTA<0,则 x→∞ ,g(y)=−∞,(注意原LP里面对 x 的非负约束),如果 −cT+yTA≥0,则 x→0 ,g(y)=yTb。所以对偶问题就是:
y≥0maxg(y)s.t.=y≥0max−yTb−cT+yTA≥0整理一下
y≥0minfs.t.ATyy=bTy≤c≥0如果原问题是个标准形式,也就是 Ax=b,这个等式约束可以换成两个不等式约束 Ax≤b 和 −Ax≤−b,同样的道理构造拉格朗日函数,这时候需要用到两个乘子 y1 和 y2,分别对应 Ax≤b 和 −Ax≤−b 这两个约束。
L(x,y1,y2)=−cTx+y1T(Ax−b)+y2T(−Ax+b)g(y1,y2)=xinfL(x,y1,y2)=xinf(−cTx+y1T(Ax−b)+y2T(−Ax+b))=−y1Tb+y2Tb+xinf((−cT+y1TA−y2TA)x)如果 −cT+y1TA−y2TA<0,则 x→∞ ,g(y1,y2)=−∞,(注意原LP里面对 x 的非负约束),如果 −cT+y1TA−y2TA≥0,则 x→0 ,g(y1,y2)=−y1Tb+y2Tb。所以对偶问题就是:
y1≥0,y2≥0maxg(y1,y2)s.t.=y1≥0,y2≥0max−y1Tb+y2Tb−cT+y1TA−y2TA≥0整理一下
y1≥0,y2≥0minfs.t.=bTy1−bTy2ATy1−ATy2≤c回忆一下化标准型流程中处理无约束变量的步骤:对于无约束变量 xj,引入两个非负变量 xj+≥0 和 xj−≥0,使得 xj=xj+−xj−。这样就将无约束变量转化为两个非负变量。这里的 y1 和 y2 就是对应于原问题中无约束变量的两个非负变量。最终我们可以将 y=y1−y2 作为对偶变量,这个 y 就没有非负约束了。
线性规划的对偶理论#
A. 弱对偶性 (Weak Duality)
若 x 是原问题的可行解,y 是对偶问题的可行解,则:
cTx≤bTy推论1(最优性准则):如果原问题有一个可行解 x 和对偶问题有一个可行解 y,且满足 cTx=bTy,则 x 和 y 都是各自问题的最优解。
推论2:若LP有可行解,那么LP有最优解的充要条件是:DP有可行解。或者说,LP有可行解而DP无可行解 ⟹ LP无最优解。
推论3:若DP有可行解,那么DP有最优解的充要条件是:LP有可行解。或者说,DP有可行解而LP无可行解 ⟹ DP无最优解。
B. 强对偶性/主对偶定理 (Strong Duality)
若原问题有最优解 x∗,则对偶问题必有最优解 y∗,且:
cTx∗=bTy∗反之亦然
C. 互补松弛性 (Complementary Slackness)
这是求解中最有用的性质。在最优解处:如果某个资源有剩余(Ax<b),那么该资源的对偶价格(影子价格)一定为 0(y=0)。如果某个资源的影子价格大于 0(y>0),那么该资源一定被全部用完(Ax=b)。
D. 解的状态对应
原问题有最优解 ⟺ 对偶问题有最优解。
原问题具有无界解 ⟹ 对偶问题无可行解。
原问题无可行解 ⟹ 对偶问题具有无界解或无可行解。