支援向量機

一、svm演算法原理及數學推導

1、支撐向量機，svm(support vector machine)，其實就是乙個線性分類器。在最初接到這個演算法時，我們可能會一頭霧水：這個名詞好奇怪[問號臉]，怎麼「支援」？什麼「向量」，哪來的「機」？

本篇文章從「不適定問題」開始介紹svm的思想，通過支撐向量與最大間隔引申到如何將其轉換為最優化問題，並數學推導求解有條件限制的最優化問題。相信學完本篇之後，大家一定會對svm演算法有乙個大體上的認識。

首先，我們看乙個簡單的二分類問題。在二維的特徵平面中，所有的資料點分為了兩類：藍色圓形和黃色三角。我們的目標是找到了一條決策邊界，將資料分類。但實際上我們可以找到多條決策邊界。

這就所謂的「不適定問題」。「不適定問題」會影響模型的泛化性。比如在下面的模型中，被黃色箭頭標出的點被決策邊界劃為藍色圓點，但實際上它和黃色三角更近一些。也就說決策邊界的選擇，不僅要考慮已經存在的資料上的是否分類正確，還要考慮是否能夠更好地劃分未出現的測試資料：

邏輯回歸演算法如何解決「不適定問題」問題呢？首先定義乙個概率函式sigmoid函式：

二、svm演算法中的核函式

三、 svm演算法解決分類問題及回歸問題