機器學習 svm不同核函式介紹及選擇

2021-08-15 19:41:07 字數 760 閱讀 2598

首先介紹線性核函式的概念:就是沒有核函式,用θ0+

θ1*x1+θ2*x2+...θn*xn進行分類。

假設有資料有n個特徵,m條資料:

則當n很大,m很小的時候,用線性核函式。

n很小,m很大的時候,用高斯核函式。

選擇高斯核函式的時候需要調整引數δ,如果δ的平方很大,

那麼你就有可能得到乙個較大的誤差、較低方差的分類器。

但是如果σ 的平方很小,那麼你就會有較大的方差,較低誤差的分類器。

正常情況下就使用以上兩種核函式,另外還有幾個核函式:

多項式核函式,公式如上圖所示。以及字串核函式等等,用以比較兩個字串之間的相似度。但這些都使用很少。

關於何時使用logistic regression或是svm:

當n遠大於m時,用logistic或者svm線性核函式,因為此時資料不足沒法很好擬合。

當m數量不多也不少,n不多的時候,用高斯核函式,此時擬合得可以很好。

當m很大的,n較小的時候,用logistic或者svm線性核函式,因為此時用高斯核函式的話,計算機的計算速度會很慢。

機器學習 SVM(核函式 高斯核函式RBF)

1 格式 2 多項式核函式 對傳入的樣本資料點新增多項式項 新的樣本資料點進行點乘,返回點乘結果 一維特徵的樣本,兩種型別,分布如圖,線性不可分 為樣本新增乙個特徵 x2 使得樣本在二維平面內分布,此時樣本在 x 軸公升的分布位置不變 如圖,可以線性可分 3 優點 特點 一般將原始樣本變形,通常是將...

機器學習 SVM(3)核函式

更詳細的講解可以參考原部落格。1 為什麼引入核函式呢?為了回答這個問題,我們先來說明什麼是線性不可分資料。如下左圖所示,如果資料能用一條直線或乙個超平面分開的資料,就是線性不可分資料。那麼什麼是線性不可分資料呢?如下右圖所示,我們無法用一條直線或乙個超平面分開的資料。很不幸的是我們之前介紹的svm是...

機器學習 SVM核函式的計算

在 機器學習 推導支援向量機svm二分類中,我們已經推導出線性核svm的對偶優化問題 j i i 12 i j i jd idjk xi tk x j i i 12 i j i jdi djk xi,x j su bjec tto idi 0,0 i c 在優化好 i 拉格朗日量後,我們得到的w和b...