拉格朗日對偶

優化理論中，目標函式f(x)有多種形式：目標函式和約束條件都是x的線性函式，稱最優化問題為線性規劃；目標函式為二次函式，約束條件為線性函式，稱最優化問題為二次規劃；目標函式或約束條件為非線性函式，稱最優化問題為非線性規劃。

每個線性規劃問題都有對應的對偶問題，對偶問題性質：

對偶問題的對偶是原問題

原始問題是否為凸，對偶問題都是凸優化問題

對偶問題可以給原始問題乙個下界

滿足一定條件時，原始問題與對偶問題解完全等

下面例子中，原始問題非凸，對偶問題是凸：

原始問題

不等式約束優化問題：

定義拉格朗日如下：

根據以上拉格朗日得到結論：

(*)很容易驗證，因為 hi(x) = 0，而 gj(x) ≤ 0，βj ≥ 0，得 βjgj(x) ≤ 0，所以最大值是都取0時，這個時候只剩下 f(x) 。反之如果任意乙個約束條件不滿足，只需令其相應的乘子→ +∞，則 l(x, α, β)→ +∞，這樣導致問題無解，因此必須滿足約束條件。經過這一轉變，約束融合到一起得到如下無約束優化目標：

對偶問題

上式與原優化目標等價，稱作原始問題，將原始問題的解記做 p* ，如此便把帶約束問題轉化為無約束的原始問題，其實只是乙個形式上的重寫，方便找到其對應的對偶問題，首先為對偶問題定義乙個對偶函式：

有了對偶函式就可給出對偶問題了，只是把 min 和 max 交換了一下：

然後定義對偶問題的最優解即關於 α, β 的函式：

對偶問題和原始問題的最優解並不相等，而是滿足如下關係：

直觀理解為最小的裡面中最大的那個要比最大的裡面中最小的那個要大。證明過程：

對偶問題與原始問題的關係如下：

即 d(α, β) ≤ f(x)，自然而然得到：

即通過對偶性，為原始問題引入乙個下界，

d*≤ p*

。

這個性質便叫做弱對偶性，對所有優化問題都成立，即使原始問題非凸。

這裡還有兩個概念：

f(x) - d(α, β)叫做對偶間隔，p*-d*叫做最優對偶間隔。

之前提到無論原始問題什麼形式，對偶問題總是乙個凸優化問題，這樣對於那些難以求解的原始問題（甚至np問題），均可通過轉化為對偶問題，通過優化這個對偶問題得到原始問題的乙個下界，與弱對偶性相對應的有乙個強對偶性，強對偶性滿足：

d* = p*

強對偶成立的情況下，可以通過求解對偶問題得到原始問題的解，在svm中就是這樣做的。

當然並不是所有的對偶問題都滿足強對偶性，在svm中是直接假定了強對偶性的成立，其實只要滿足一些條件，強對偶性是成立的，比如說slater條件與kkt條件。

slater條件

若原始問題為凸優化問題，且存在嚴格滿足約束條件的點 x，這裡「嚴格」指 gi(x) ≤ 0 中的「≤」嚴格取到「

=d∗=

l(x∗

,α∗,

β∗)'>p∗=d∗=l(x∗,α∗,β∗)

也就是說如果原始問題是凸優化問題並且滿足 slater 條件的話，那麼強對偶性成立。需要注意的是，這裡只是指出了強對偶成立的一種情況，並不是唯一的情況。例如，對於某些非凸優化的問題，強對偶也成立。svm 中的原始問題是乙個凸優化問題（二次規劃也屬於凸優化問題），slater 條件在 svm 中指的是存在乙個超平面可將資料分隔開，即資料是線性可分的。當資料不可分時，強對偶是不成立的，這個時候尋找分隔平面這個問題本身也就是沒有意義了，所以對於不可分的情況預先加個 kernel 就可以了。

來自：

拉格朗日對偶

拉格朗日對偶

拉格朗日對偶函式拉格朗日對偶問題

拉格朗日對偶，KKT，SVM

拉格朗日對偶

拉格朗日對偶

拉格朗日對偶函式 拉格朗日對偶問題

拉格朗日對偶，KKT，SVM

相關推薦

拉格朗日對偶函式拉格朗日對偶問題