PCA的劣勢分析

2021-09-13 15:27:48 字數 395 閱讀 4259

pca原理剖析

矩陣的秩 特徵向量 特徵值是什麼?

此篇部落格主要分析pca有什麼劣勢以及產生的原因,對pca還不清楚的可以結合上面兩個部落格從多角度深入了解pca。

因為pca需要對資料進行預處理,第一步需要對其進行中心化,如果資料的尺度不統一,還需要標準化。通常的標準化方式是除以標準差。這裡可能就出出現乙個問題,比如標準差很小,接近於零,尤其是被雜訊汙染的資料,雜訊的標準差對資料的放大作用更顯著,而沒被雜訊汙染的資料其在標準化的過程中放大作用較小。

使用pca進行線性降維後樣本間的非線性相關性有可能會丟失

判斷是否是線性降維過程可以用乙個線性變換表示決定。pca降維的過程可以通過資料乘以乙個矩陣表示,因此就是乙個樸素的線性變換。

pca主成分分析 PCA主成分分析(中)

矩陣 matrix,很容易讓人們想到那部著名的科幻電影 駭客帝國 事實上,我們又何嘗不是真的生活在matrix中。機器學習處理的大多數資料,都是以 矩陣 形式儲存的。矩陣是向量的組合,而乙個向量代表一組資料,資料又是多維度的。比如每個人的都具有身高 體重 長相 性情等多個維度的資訊資料,而這些多維度...

穩定幣GUSD的優劣勢分析

在幣圈,有人乘著牛市東風一夜暴富,也有人不幸趕上熊市傾家蕩產,漲跌大起大落是幣圈的常態,在如此不穩定的幣市,投資者們都想尋求一些穩定。接著,穩定幣誕生了。2018年下半年,穩定幣引起了各路投資者的高度關注,其中gusd是穩定幣的代表之一,本文就和大家詳細聊聊gusd的優劣勢。gusd是什麼?2018...

主成分分析PCA

主要參考這篇文章 個人總結 pca是一種對取樣資料提取主要成分,從而達到降維的目的。相比於上篇文章介紹到的svd降維不同,svd降維是指減少資料的儲存空間,資料的實際資訊沒有缺少。個人感覺pca更類似與svd的去噪的過程。pca求解過程中,涉及到了svd的使用。針對資料集d 假設di 的維度為 w ...