PCA與PLS的區別

主成分分析（pca）是一種無監督學習方法，通過對資料做正交旋轉變換，使變換後的變數都是正交的。目的是對多變數資料資訊進行調整組合，提取較少的綜合變數特徵去解釋原來資料資料的大部分資訊。也就是在力保資料資訊損失最少的原則下，對高維資料空間進行降維。

pca降維之後得到的特徵變數通常是原始變數特徵的線性組合（kpca通過核函式的方法得到非線性特徵），主成分之間相互正交，消除了變數之間的多重共線性。但是在pca降維過程中，因變數（響應變數）並沒有參與指導主成分的構造，所以pca有乙個弊端：無法保證很好地解釋**變數的方向同時可以很好地**因變數。

偏最小二乘回歸（pls）是一種監督式方法，包含了主成分分析、典型相關分析的思想。利用pls降維的目的是使提取後得到的特徵變數不僅能很好的概括原始變數的資訊，而且對因變數有很強的解釋能力。

具體過程為分別從自變數和因變數中提取成分t,u(偏最小二乘因子)，保證t,u能盡可能多的提取所在變數組的變異資訊，同時保證二者之間的相關性最大。pls把m個主成分作為新的變數集，在此基礎上進行最小二乘回歸，所以響應變數起到了調整各主成分引數的作用。偏最小二乘回歸可以較好的解決樣本個數少於變數個數的問題，並且除了考慮自變數矩陣外，還考慮了相應矩陣。

PCA與PLS的區別

PCA與SVD的區別和聯絡

學習筆記一LDA降維與PCA的區別

PCA 和 SVD 的區別和聯絡

PCA與PLS的區別

PCA與SVD的區別和聯絡

學習筆記一LDA降維與PCA的區別

PCA 和 SVD 的區別和聯絡

相關推薦