關於SVM核函式的選擇

2021-08-09 11:17:59 字數 626 閱讀 2053

今天去面試的時候,面試官問了我乙個問題:svm的核函式如何選擇?我說試試吧,答案可能也對,但這樣會浪費時間。

上網搜尋了一下,andrew的說法是:

1.當樣本的特徵很多時,特徵的維數很高,這是往往樣本線性可分,可考慮用線性核函式的svm或lr(如果不考慮核函式,lr和svm都是線性分類演算法,也就是說他們的分類決策面都是線性的)。

2.當樣本的數量很多,但特徵較少時,可以手動新增一些特徵,使樣本線性可分,再考慮用線性核函式的svm或lr。

3.當樣特徵維度不高時,樣本數量也不多時,考慮用高斯核函式(rbf核函式的一種,指數核函式和拉普拉斯核函式也屬於rbf核函式)。

lr和svm都是判別模型,判別模型會生成乙個表示p(y|x)的判別函式(或**模型),而生成模型先計算聯合概率p(y,x)然後通過貝葉斯公式轉化為條件概率。簡單來說,在計算判別模型時,不會計算聯合概率,而在計算生成模型時,必須先計算聯合概率。或者這樣理解:生成演算法嘗試去找到底這個資料是怎麼生成的(產生的),然後再對乙個訊號進行分類。基於你的生成假設,那麼那個類別最有可能產生這個訊號,這個訊號就屬於那個類別。判別模型不關心資料是怎麼生成的,它只關心訊號之間的差別,然後用差別來簡單對給定的乙個訊號進行分類。常見的判別模型有:knn、svm、lr,常見的生成模型有:樸素貝葉斯,隱馬爾可夫模型。

SVM核函式選擇

svm支援向量機,一般用於二分類模型,支援線性可分和非線性劃分。svm中用到的核函式有線性核 linear 多項式核函式pkf以及高斯核函式rbf。當訓練資料線性可分時,一般用線性核函式,直接實現可分 當訓練資料不可分時,需要使用核技巧,將訓練資料對映到另乙個高維空間,使再高維空間中,資料可線性劃分...

SVM 核函式的選擇

1 經常使用的核函式 核函式的定義並不困難,根據泛函的有關理論,只要一種函式k xi,x j 滿足mercer條件,它就對應某一變換空間的內積 對於判斷哪些函式是核函式到目前為止也取得了重要的突破,得到mercer定理和以下常用的核函式型別 1 線性核函式k x,x i x xi 2 多項式核k x...

SVM中關於核函式的理解

如果訓練樣本不是線性可分的,那麼只要樣本的屬性是有限個,就可以將其對映到高維特徵空間,使這些樣本線性可分.問題 為什麼要讓這些樣本線性可分?當對映到高維空間後,想要得到模型 function 那麼計算難度是非常大的.此時我們可以使用核函式來簡化計算.那麼什麼樣的函式可以作為核函式呢?只要乙個對稱函式...