用PCA對鳶尾花資料集降維並視覺化

2022-06-12 13:39:10 字數 1206 閱讀 1324

上篇部落格中,我們介紹了並用**實現了pca演算法,本篇部落格我們應用pca演算法對鳶尾花資料集降維,並視覺化。

鳶尾花資料集簡介

**實現

**來自mooc網的《python機器學習應用》課程。

import matplotlib.pyplot as plt

from sklearn.decomposition import pca

from sklearn.datasets import load_iris

data = load_iris() # 以字典形式載入鳶尾花資料集

y = data.target # 使用y表示資料集中的標籤

x = data.data # 使用x表示資料集中的屬性資料

pca = pca(n_components=2) # 載入pca演算法,設定降維後主成分數目為2

reduced_x = pca.fit_transform(x) # 對原始資料進行降維,儲存在reduced_x中

red_x, red_y = , # 第一類資料點

blue_x, blue_y = , # 第二類資料點

green_x, green_y = , # 第三類資料點

for i in range(len(reduced_x)): # 按照鳶尾花的類別將降維後的資料點儲存在不同的列表中。

if y[i] == 0:

elif y[i] == 1:

else:

plt.scatter(red_x, red_y, c='r', marker='x')

plt.scatter(blue_x, blue_y, c='b', marker='d')

plt.scatter(green_x, green_y, c='g', marker='.')

plt.show()

執行結果:

參考資料

[1] 鳶尾花資料集

資料降維 PCA 基於鳶尾花資料集

主成分分析pca 主成分分析 principal component analysis,pca 主成分 可以把具有相關性的高緯度變數,合成為線性無關的低緯度變數,稱為主成分。主成分能夠盡可能保留原始資料的資訊。原理 矩陣的主成分就是其協方差矩陣對應的特徵向量,按照對應的特徵值大小進行排序,最大的特徵...

PCA演算法之對鳶尾花資料降維處理並視覺化

import matplotlib.pyplot as plt 載入matplotlib用於資料的視覺化 from sklearn.decomposition import pca 載入pca演算法包 from sklearn.datasets import load iris 載入鳶尾花資料 da...

鳶尾花資料集

from sklearn import datasets iris datasets.load iris iris是乙個字典集keys iris.keys dict keys data target target names descr feature names data iris.data.sh...