svm中引數的選擇方法

2021-04-13 08:10:38 字數 392 閱讀 1589

支援向量機引數的取值直接影響到分類器的學習能力和推廣能力。通常通過計算分類器的推廣誤差來衡量引數的優劣,常用的方法有k重交叉驗證和留一法。 

k重交叉驗證法:該方法是最為普遍的計算推廣誤差的方法之一。其過程為:將訓練樣本集隨機分為k個集合,通常分為k等份,對其中的k-1個集合進行訓練,得到乙個決策函式,並用決策函式對剩下的乙個集合進行樣本測試。該過程重複k次,取k次過程中的測試錯誤的平均值作為推廣誤差。

留一法:該方法可以說是k重交叉驗證法的極端情況,即k=l,l為整個訓練樣本集的大小。該過程為 :對於第i個訓練樣本,將其取出,對剩下l-1個樣本進行訓練,得到決策函式,並用其測試第i個訓練樣本,該過程重複l次,用此方法求出的誤差對於實際中的測試誤差來說幾乎是無偏的。

SVM演算法的引數

1.c float引數,預設值為1.0 2.kernel str引數,預設為 rbf 演算法中提供的核函式型別,可選引數有 除了上面限定的核函式外,還可以給出自己定義的核函式,內部就是用自己定義的核函式來計算核矩陣。3.degree int型,預設為3 4.gamma float引數,預設為auto...

SVM 正則化,歸一化及引數的選擇

正則化 regularization 歸一化 也有稱為正規化 標準化,normalization 是對資料盡心預處理的方式,他們的目的都是為了讓資料更便於我們的計算或獲得更加泛化的結果,但並不改變問題的本質,下面對他們的作用分別做一下科普,如有不正確之處,求指正!需要注意的是,這些名詞在不同的領域含...

SVM 核函式的選擇

1 經常使用的核函式 核函式的定義並不困難,根據泛函的有關理論,只要一種函式k xi,x j 滿足mercer條件,它就對應某一變換空間的內積 對於判斷哪些函式是核函式到目前為止也取得了重要的突破,得到mercer定理和以下常用的核函式型別 1 線性核函式k x,x i x xi 2 多項式核k x...