關於SVM核函式的選擇

今天去面試的時候，面試官問了我乙個問題：svm的核函式如何選擇？我說試試吧，答案可能也對，但這樣會浪費時間。

上網搜尋了一下，andrew的說法是：

1.當樣本的特徵很多時，特徵的維數很高，這是往往樣本線性可分，可考慮用線性核函式的svm或lr（如果不考慮核函式，lr和svm都是線性分類演算法，也就是說他們的分類決策面都是線性的）。

2.當樣本的數量很多，但特徵較少時，可以手動新增一些特徵，使樣本線性可分，再考慮用線性核函式的svm或lr。

3.當樣特徵維度不高時，樣本數量也不多時，考慮用高斯核函式（rbf核函式的一種，指數核函式和拉普拉斯核函式也屬於rbf核函式）。

lr和svm都是判別模型，判別模型會生成乙個表示p(y|x)的判別函式（或**模型），而生成模型先計算聯合概率p(y,x)然後通過貝葉斯公式轉化為條件概率。簡單來說，在計算判別模型時，不會計算聯合概率，而在計算生成模型時，必須先計算聯合概率。或者這樣理解：生成演算法嘗試去找到底這個資料是怎麼生成的（產生的），然後再對乙個訊號進行分類。基於你的生成假設，那麼那個類別最有可能產生這個訊號，這個訊號就屬於那個類別。判別模型不關心資料是怎麼生成的，它只關心訊號之間的差別，然後用差別來簡單對給定的乙個訊號進行分類。常見的判別模型有：knn、svm、lr，常見的生成模型有：樸素貝葉斯，隱馬爾可夫模型。

關於SVM核函式的選擇

SVM核函式選擇

SVM 核函式的選擇

SVM中關於核函式的理解

關於SVM核函式的選擇

SVM核函式選擇

SVM 核函式的選擇

SVM中關於核函式的理解

相關推薦