主成分分析和核函式

主成分分析（pca）的主要作用是降低資料的維度，提取其主要特徵，因為現實中很多資料都是很稀疏的，通過提取主要特徵過濾噪音發現其潛在的規律；核函式表示了兩個資料之間的相似性。那麼這兩者之間存在什麼樣的關係？直觀上理解，pca和核側重的是兩個相反的方向，下面給出解釋。

考慮下面的高斯核，

此時協方差矩陣

由以上可知，如果

另一方面，從pca的角度考慮，如果

從以上分析可以看出，pca關注的是區分度，差異性，而kernel關注的是相似度，pca最希望保留的特徵恰恰是kernel可以忽略的，而kernel保留的，很可能被pca忽略掉了。

需要注意的是，我們上面考慮的是一種極端的情況，方差是無窮大，真實資料方差不會是無窮大，我們降維以後，資料的相似性也不會是0，被忽略掉的特徵的相似性也不完全相同。上面的極端例子只是為了說明pca和核函式側重的是資料的兩個方面，乙個側重差異性，另乙個側重相似性。