SVM的引數說明

sklearn中svm，svm主要有linearsvc、nusvc和svc三種方法。

linearsvc(penalty='l2', loss='squared_hinge', dual=true, tol=0.0001, c=1.0, multi_class='ovr', fit_intercept=true, 
intercept_scaling=1, class_weight=none, verbose=0, random_state=none, max_iter=1000)

penalty:正則化引數，l1和l2兩種引數可選，僅linearsvc有。

loss:損失函式，有『hinge』和『squared_hinge』兩種可選，前者又稱l1損失，後者稱為l2損失，預設是是』squared_hinge』，其中hinge是svm的標準損失，squared_hinge是hinge的平方。

dual:是否轉化為對偶問題求解，預設是true。

tol:殘差收斂條件，預設是0.0001，與lr中的一致。c:懲罰係數，用來控制損失函式的懲罰係數，類似於lr中的正則化係數。

multi_class:負責多分類問題中分類策略制定，有『ovr』和『crammer_singer』兩種引數值可選，預設值是』ovr』，'ovr'的分類原則是將待分類中的某一類當作正類，其他全部歸為負類，通過這樣求取得到每個類別作為正類時的正確率，取正確率最高的那個類別為正類；『crammer_singer』是直接針對目標函式設定多個引數值，最後進行優化，得到不同類別的引數值大小。

fit_intercept:是否計算截距，與lr模型中的意思一致。

class_weight:與其他模型中引數含義一樣，也是用來處理不平衡樣本資料的，可以直接以字典的形式指定不同類別的權重，也可以使用balanced引數值。

verbose:是否冗餘，預設是false。

random_state:隨機種子的大小。

max_iter:最大迭代次數，預設是1000。

coef_:各特徵的係數（重要性）。

intercept_:截距的大小（常數值）。

nusvc(nu=0.5, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=true, probability=false, 
tol=0.001, cache_size=200, class_weight=none, verbose=false, max_iter=-1, decision_function_shape='ovr', 
random_state=none))

nu:訓練誤差部分的上限和支援向量部分的下限，取值在（0，1）之間，預設是0.5

kernel:核函式，核函式是用來將非線性問題轉化為線性問題的一種方法，預設是「rbf」核函式

degree:當核函式是多項式核函式的時候，用來控制函式的最高次數。（多項式核函式是將低維的輸入空間對映到高維的特徵空間）

gamma:核函式係數，預設是「auto」，即特徵維度的倒數。

coef0:核函式常數值(y=kx+b中的b值)，只有『poly』和『sigmoid』核函式有，預設值是0。

max_iter:最大迭代次數，預設值是-1，即沒有限制。

probability:是否使用概率估計，預設是false。

cache_size:緩衝大小，用來限制計算量大小，預設是200m。

decision_function_shape:與'multi_class'引數含義類似。

support_:以陣列的形式返回支援向量的索引。

support_vectors_:返回支援向量。n_support_:每個類別支援向量的個數。

dual_coef_:支援向量係數。

coef_:每個特徵係數（重要性），只有核函式是linearsvc的時候可用。

intercept_:截距值（常數值）。

svc(c=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=true, probability=false, tol=0.001, 
cache_size=200, class_weight=none, verbose=false, max_iter=-1, decision_function_shape='ovr', random_state=none)

c:懲罰係數。

svc和nusvc方法基本一致，唯一區別就是損失函式的度量方式不同（nusvc中的nu引數和svc中的c引數）。

三種分類方法的方法基本一致

decision_function(x):獲取資料集x到分離超平面的距離。

fit(x, y):在資料集(x,y)上使用svm模型。

get_params([deep]):獲取模型的引數。

predict(x):**資料值x的標籤。

score(x,y):返回給定測試集和對應標籤的平均準確率。

常用的核函式有以下幾種：表示

解釋linear

線性核函式

poly

多項式核函式

rbf高斯核函式

sigmod

sigmod核函式

precomputed

自定義核函式

SVM的引數說明

Cache control引數說明

nmap引數說明

toString引數說明

SVM的引數說明

Cache control引數說明

nmap引數說明

toString引數說明

相關推薦