SVM推導簡述

2021-07-23 06:55:40 字數 2330 閱讀 9284

1.函式間隔和幾何間隔:

點距離分離平面的遠近可以代表分類**的確信度,在超平面w⋅

x+b=

0 確定的情況下,|w

⋅x+b

| 表示點x距離超平面的遠近,由於w,

b 可以成比例改變,超平面不變,所以需要對分離平面法向量進行約束,因此定義函式間隔和幾何間隔分別為:γ¯

i=yi

(w⋅x

i+b)

γi=y

i(w⋅

xi+b

)||w

||求所有樣本的間隔最小值得:γ¯

=mini=

1,..

,nγi

¯γ=mini=

1,..

.,nγ

i 2.線性可分間隔最大化:

直觀理解:對最難分的點(離超平面最近的點)也要有足夠大的確信度,因此可得到目標函式

maxw,b

γyi(

w⋅xi

+b)|

|w||

≥γ,i

=1,.

.,n

考慮幾何間隔與函式間隔的關係,改寫為

maxw,b

γ¯||

w||y

i(w⋅

xi+b

)≥γ¯

,i=1

,..,

n 函式間隔γ¯

可根據w,

b 成比例改變,因此可取任意值,將其設為1,由於最大化1|

|w||

與最小化12

||w|

|2等價,得到線性可分支援向量機,是乙個凸二次規劃問題(統計學習方法p100)

minw,b

12||

w||2

yi(w

⋅xi+

b)≥1

,i=1

,..,

n 3.線性不可分加入鬆弛因子

不能完全把點分開時,在約束條件中加入鬆弛因子

ξ ,同時需要在目標函式中進行懲罰,並給出懲罰力度,得到線性支援向量機

minw,b

12||

w||2

+c∑i

=1nξ

iyi(

w⋅xi

+b)≥

1−ξi

,i=1

,..,

n 4.轉化為對偶形式

minα12

∑i=1

n∑j=

1nαi

αjyi

yj(x

i⋅xj

)−∑i

=1nα

is.t

.∑i=

1nαi

yi=0

,0⩽α

i⩽c

此時,變數個數為樣本長度,原問題變數個數為特徵向量長度,只有支援向量

α>

0 分開的xi

變為向量內積方便使用核函式。當

0<

α<

c ,則ξ=

0 ,支援向量落在間隔邊界上;當α=

c,0<

ξ<

1 ,分類正確,落在間隔邊界和分離超平面之間;當α=

c,ξ>

1 ,分類錯誤。再求解w,

b ,其中b可以用間隔邊界上(

0<

α<

c )的乙個點或所有點求平均得到w=

∑i=1

nαiy

ixi,

b=yj

−∑i=

1nyi

αi(x

i⋅xj

) 1.判別模型f(

x)=s

ign(

w⋅x+

b)2.引數

決策邊界法向量

w ,和決策邊界截距b

3.目標函式(損失函式+正則化項)

1.損失函式(hinge loss)l(

y,w⋅

x+b)

=[1−

y(w⋅

x+b)

]+ [

z]+ :當z>0時為z,z<0時為0。對於硬間隔svm,損失函式為0,即使全部1−

yi(w

⋅xi+

b)<0

2.目標函式:ob

j=∑i

=1n[

1−yi

(w⋅x

i+b)

]++λ

||w|

|2最小化該目標函式等價於上述凸二次規劃問題。令[1

−yi(

w⋅xi

+b)]

+=ξi

,λ=1

2c可證明。

3. 目標函式決定了模型生成僅與支援向量有關,與其餘大部分樣本點無關

SVM 簡要推導過程

svm 是一塊很大的內容,網上有寫得非常精彩的部落格。這篇部落格目的不是詳細闡述每乙個理論和細節,而在於在不丟失重要推導步驟的條件下從巨集觀上把握 svm 的思路。svm 支援向量機 的主要思想是找到幾何間隔最大的超平面對資料進行正確劃分,與一般的線性分類器相比,這樣的超平面理論上對未知的新例項具有...

SVM 簡要推導過程

svm 是一塊很大的內容,網上有寫得非常精彩的部落格。這篇部落格目的不是詳細闡述每乙個理論和細節,而在於在不丟失重要推導步驟的條件下從巨集觀上把握 svm 的思路。svm 支援向量機 的主要思想是找到幾何間隔最大的超平面對資料進行正確劃分,與一般的線性分類器相比,這樣的超平面理論上對未知的新例項具有...

SVM 簡要推導過程

svm 是一塊很大的內容,網上有寫得非常精彩的部落格。這篇部落格目的不是詳細闡述每乙個理論和細節,而在於在不丟失重要推導步驟的條件下從巨集觀上把握 svm 的思路。svm 支援向量機 的主要思想是找到幾何間隔最大的超平面對資料進行正確劃分,與一般的線性分類器相比,這樣的超平面理論上對未知的新例項具有...