機器學習 05 SVM

學習內容

演算法簡介：

支援向量機（support vector machines，svm）是一種二類分類模型，它的基本模型是定義在特徵空間上的間隔最大的線性分類汽車，間隔最大使它有別於感知機。支援向量機還包括核技巧，這使它成為實質上的非線性分類器，支援向量機的學習策略就是間隔最大化，可形成化為乙個求解凸二次規劃（convex quadratic programming）的問題，也等價於正則化的合頁損失函式的最小化問題。支援向量機的學習演算法是求解凸二次規劃的最優化演算法。

支援向量機學習方法包含構建由簡至繁的模型：線性可分支援向量機（linear support vector machine in linearly separable case）、線性支援向量機（linear support vector machine）、非線性支援向量機（non-linear support vector machine）。其中線性可分支援向量機定義如下所示。

最小間距超平面：所有樣本到平面的距離最小。而距離度量有了函式間隔和幾何間隔，函式間隔與法向量

但是支援向量機提出了最大間隔分離超平面，這似乎與上面的分析相反，其實這個最大間隔是個什麼概念呢？通過公式來分析一下，正常我們假設超平面公式是：

也就是說對於所有的樣本到超平面距離都大於

超平面（w,b）關於樣本點

支援向量機學習的基本思路：求解能夠正確劃分訓練資料集並且幾何間隔最大的分離超平面。對線性可分的訓練資料集而言，線性可分分離超平面有無窮多個（等價於感知機），但幾何間隔最大的分離超平面是唯一的（可以被證明）。這裡的間隔最大化又稱為硬間隔最大化。

這裡用到了線性可分支援向量機學習演算法——最大間隔法。

線性可分問題的支援向量機學習方法，對於線性不可分訓練資料不適用。因為此時上述方法中的不等式約束並不能成立。解決此問題需要使其軟間隔最大化。

對於線性不可分理解：某些樣本點

（可以證明線性不可分的線性支援向量機的學習問題是下凸二次規劃問題）

參考：《統計學方法》

機器學習 05 SVM

資料分析05 SVM

機器學習 SVM

機器學習 SVM

機器學習 05 SVM

資料分析05 SVM

機器學習 SVM

機器學習 SVM

相關推薦