PCA演算法之對鳶尾花資料降維處理並視覺化

2021-10-02 13:25:05 字數 1055 閱讀 7722

import matplotlib.pyplot as plt

#載入matplotlib用於資料的視覺化

from sklearn.decomposition import pca

#載入pca演算法包

from sklearn.datasets import load_iris

#載入鳶尾花資料

data = load_iris(

)#以字典形式載入資料

y=data.target#使用y表示資料集中的標籤

x=data.data#使用x表示資料集的屬性資料

pca=pca(n_components=2)

#載入pca演算法,設定降維後的維度為2

reduced_x=pca.fit_transform(x)

#對原始資料進行降維,儲存在reduced_x中

red_x,red_y=

,blue_x,blue_y=

,green_x,green_y=

,#三類資料點

#按照鳶尾花的類別進行降維處理

for i in

range

(len

(reduced_x)):

if y[i]==0

:[0]

)[1]

)elif y[i]==1

:[0]

)[1]

)else:[

0])[

1])#對降維後的資料視覺化

資料降維 PCA 基於鳶尾花資料集

主成分分析pca 主成分分析 principal component analysis,pca 主成分 可以把具有相關性的高緯度變數,合成為線性無關的低緯度變數,稱為主成分。主成分能夠盡可能保留原始資料的資訊。原理 矩陣的主成分就是其協方差矩陣對應的特徵向量,按照對應的特徵值大小進行排序,最大的特徵...

用PCA對鳶尾花資料集降維並視覺化

上篇部落格中,我們介紹了並用 實現了pca演算法,本篇部落格我們應用pca演算法對鳶尾花資料集降維,並視覺化。鳶尾花資料集簡介 實現 來自mooc網的 python機器學習應用 課程。import matplotlib.pyplot as plt from sklearn.decomposition...

利用KNN對鳶尾花資料進行分類

knn k nearest neighbor 工作原理 存在乙個樣本資料集合,也稱為訓練樣本集,並且樣本集中每個資料都存在標籤,即我們知道樣本集中每一資料與所屬分類對應的關係。輸入沒有標籤的資料後,將新資料中的每個特徵與樣本集中資料對應的特徵進行比較,提取出樣本集中特徵最相似資料 最近鄰 的分類標籤...