機器學習第六課 SVM（1）

（1）在前幾個課程學習過程中沒有發現，後來才突然想到的乙個問題是：為什麼logistic 回歸依然算是線性分類器呢？在logistic回歸中，h(x) = g( \theta*x )，而這個g( z ) = 1/（1- exp(-z)），在我的理解中它不應該屬於線性分類器了吧。

解釋：我們判斷乙個新的輸入樣本屬於哪一類的時候，是依據 h(x) 與0.5的大小關係來判斷的（其實從logistic的畫圖曲線也可以直接看出），當 h(x) > 0.5 時，判別為1，否則判別為0，等價表示是：當\theta*x > 0 時，判別為1，否則判別為0。我想從這個角度可以很清晰地看出，為什麼logistic回歸依然被劃分為線性分類器。因為本質上它仍然在分類過程中通過在特徵平面上畫直線（即\theta*x = 0）來判別。理解了這個也就可以更好地理解這節課中svm畫出來的那個超平面（二維裡是一條線）。

（2）對函式間隔的理解。

函式間隔的表示式為：

目的是使得函式間隔越大越好，但是緣由是什麼呢？老師說這是一種直觀的理解，但卻不同於幾何間隔表示的是圖形中的最短距離。我是這樣理解的：在h(x)中，假如wt x + b 大於等於零，那麼判別h(x)為1，假如wt x + b 小於零則判別為-1. 那這個時候就講到了自信度（自創哈，「confidence」的意思），假如在訓練過程中，對於標籤y=1, 那麼，wt x + b 遠遠地大於0的話，那我就更加有信心地說分類是對的；對於y=-1的情況，若果wt x + b 遠遠地小於0的話，那麼我也就更有信心說分類**是對的。兩者都可以用乙個式子（即函式間隔的表示式）來表示。目的是使得函式間隔盡可能的大。

機器學習第六課 SVM（1）

機器學習第六課聚類

第六課字型

第六課列表

機器學習第六課 SVM（1）

機器學習第六課 聚類

第六課 字型

第六課 列表

相關推薦

機器學習第六課聚類

第六課字型

第六課列表