sklearn機器學習 PCA

pca使用的資訊量衡量指標，就是樣本方差，又稱可解釋性方差，方差越大，特徵所帶的資訊量越多

原理推導

class
sklearn
.decomposition.pca(n_components=
none,*
, copy=
true
, whiten=
false
, svd_solver=
'auto'
, tol=
0.0, iterated_power=
'auto'
, random_state=
none
)

n_components=這個引數可以幫我們指定希望pca降維後的特徵維度數目。

copy=表示是否在執行演算法時，將原始資料複製乙份。預設為true，則執行pca演算法後，原始資料的值不會有任何改變。因為是在原始資料的副本上進行運算的。

whiten=白化。所謂白化，就是對降維後的資料的每個特徵進行標準化，讓方差都為1。對於pca降維本身來說，一般不需要白化。如果你pca降維後有後續的資料處理動作，可以考慮白化。預設值是false，即不進行白化。

svd_solver=即指定奇異值分解svd的方法，由於特徵分解是奇異值分解svd的乙個特例，一般的pca庫都是基於svd實現的。有4個可以選擇的值：。

tol=

iterated_power=

random_state=

注意：當設定 n_components == 'mle』時，需要和引數svd_solver一起使用，且svd_solver需要選擇『full』引數；即pca = pca(n_components = 『mle』,svd_solver=『full』)；同時要保證輸入資料的樣本數多於特徵數才可執行成功。

另外，有兩個pca類的成員值得關注。第乙個是explained_variance_，它代表降維後的各主成分的方差值，方差值越大，則說明越是重要的主成分。第二個是explained_variance_ratio_，它代表降維後的各主成分的方差值佔總方差值的比例，這個比例越大，則越是重要的主成分。

sklearn機器學習 PCA

機器學習 PCA

機器學習一 PCA

sklearn 機器學習庫

sklearn機器學習 PCA

機器學習 PCA

機器學習 一 PCA

sklearn 機器學習庫

相關推薦

機器學習一 PCA