降維演算法之維度的概念

2021-10-03 06:21:06 字數 1124 閱讀 3180

維度有一維,二維直到多維,人類能夠觸及到的最大維度只有三維。不同情形下,維度代表的意義也不相同。

型別含義

陣列(series)

維度就是功能shape返回的結果,shape中返回了幾個數字就是幾維

圖形(graphic)

維度是影象中特徵向量的數量

對於陣列來說,維度就是功能shape返回的結果,shape中返回了幾個數字,就是幾維。

除了索引以外的資料,維數分為:

維數說明

一維無行列之分的叫一維(此時shape返回唯一的維度上的資料個數)

二維(表)

有行列之分叫二維(shape返回的是 行x列)

三維當乙個陣列中存在2張3行4列的表時,shape返回的是(更高維,行,列)

四維當陣列中存在2組2張3行4列的表時,資料就是4維,shape返回(2,2,3,4)

…直到多維…

陣列中的每一張表,都可以是乙個特徵矩陣或乙個dataframe,這些結構永遠只有一張表,所以一定有行列,行是樣本,列是特徵。針對每一張表,維度指的是樣本的數量或特徵的數量,一般無特別說明,指的都是特徵的數量。除了索引之外,乙個特徵是一維,n個特徵是n維。當有三個特徵時(三維)**樣式如下:(二維則增加特徵2以此類推)

可以理解為是座標軸,乙個特徵向量定義一條直線,是一維,兩個相互垂直的特徵向量定義乙個平面,即乙個直角座標系,就是二維,三個相互垂直的特徵向量定義乙個空間,即乙個立體直角座標系,就是三維。

在降維演算法中的」降維「,指的是降低特徵矩陣中特徵的數量。而降維的目的是:

1.為了讓演算法運算更快,效果更好;

2.資料視覺化;

從上面的圖我們其實可以看得出,影象和特徵矩陣的維度是可以相互對應的,即乙個特徵對應乙個特徵向量,對應一條座標軸。所以,三維及以下的特徵矩陣,是視覺化的,這可以幫助我們很快地理解資料的分布,而三維以上特徵矩陣的則不能被視覺化,資料的性質也就比較難理解,這就需要我們通過降維使資料視覺化。

end

PCA降維演算法

文章由兩部分構成,第一部分主要講解pca演算法的步驟,第二部分講解pca演算法的原理。那麼首先進入第一部分 pca演算法的步驟 樣本矩陣x的構成 假設待觀察變數有m個,其實相當於乙個資料在m維各維度上的座標,我們的目標是在保證比較資料之間相似性不失真的前提下,將描述資料的維度盡量減小至l維 l樣本矩...

降維演算法總結

1.降維簡介 1 相關背景 1 在許多領域的研究與應用中,通常需要對含有多個變數的資料進行觀測,收集大量資料後進行分析尋找規律。2 因此需要找到一種合理的方法,在減少需要分析的指標同時,儘量減少原指標包含資訊的損失,以達到對所收集資料進行全面分析的目的。3 由於各變數之間存在一定的相關關係,因此可以...

pca降維演算法

pca主成分分析演算法,是一種線性降維,將高維座標系對映到低維座標系中。如何選擇低維座標系呢?通過協方差矩陣的特徵值和特徵向量,特徵向量代表座標系,特徵值代表對映到新座標的長度。演算法步驟 輸入 樣本集d 低維空間維數k 第一步 將樣本集中心化。每一列的特徵值減去當前列的均值 第二步 求協方差矩陣的...