Pandas之iris資料集簡單分析

2021-08-21 15:55:24 字數 1946 閱讀 7237

匯出iris資料集

from sklearn import datasets

import pandas as np

iris_datas = datasets.load_iris()

iris_data是乙個類似字典的物件。

print(iris_datas.data) # 資料集中的資料

print(iris_datas.target_name) # iris的種類

iris = pd.dataframe(iris_datas.data, columns=['speallength', 'spealwidth', 'petallength', 'petallength'])

iris.shape

iris.head()

(150, 4)

speallength spealwidth petallength petallength

0 5.1 3.5 1.4 0.2

1 4.9 3.0 1.4 0.2

2 4.7 3.2 1.3 0.2

3 4.6 3.1 1.5 0.2

4 5.0 3.6 1.4 0.2

描述性統計
iris.describe().t     # 描述性統計轉置

花萼長度與寬度/花瓣長度與寬度的視覺化,判斷是否僅依據其即可判別鳶尾花品種。

from collection import counter, defaultdict

import matplotlib

import matplotlib.pyplot as plt

matplotlib.rcparams['font.sans-serif'] = ['simhei']

style_list = ['o', '^', 's'] # 設定點的不同形狀,不同形狀預設顏色不同,也可自定義

data = iris_datas.data

labels = iris_datas.target_names

cc = defaultdict(list)

for i, d in enumerate(data):

p_list =

c_list =

for each in [0, 2]:

for i, (c, ds) in enumerate(cc.items()):

draw_data = np.array(ds)

p = plt.plot(draw_data[:, each], draw_data[:, each+1], style_list[i])

plt.legend(map(lambda x: x[0], p_list), c_list)

plt.title('鳶尾花花瓣的長度和寬度') if each else plt.title('鳶尾花花萼的長度和寬度')

plt.xlabel('花瓣的長度(cm)') if each else plt.xlabel('花萼的長度(cm)')

plt.ylabel('花瓣的寬度(cm)') if each else plt.ylabel('花萼的寬度(cm)')

機器學習iris資料集匯入

iris資料集在模式識別研究領域應該是最知名的資料集了,有很多文章都用到這個資料集。這個資料集裡一共包括150行記錄,其中前四列為花萼長度,花萼寬度,花瓣長度,花瓣寬度等4個用於識別鳶尾花的屬性,第5列為鳶尾花的類別 包括setosa,versicolour,virginica三類 也即通過判定花萼...

用TensorFlow實現iris資料集線性回歸

本文將遍歷批量資料點並讓tensorflow更新斜率和y截距。這次將使用scikit learn的內建iris資料集。特別地,我們將用資料點 x值代表花瓣寬度,y值代表花瓣長度 找到最優直線。選擇這兩種特徵是因為它們具有線性關係,在後續結果中將會看到。本文將使用l2正則損失函式。用tensorflo...

鳶尾花 Iris 資料集

2.pandas庫基礎操作 3.資料視覺化 tf.keras.utils.get file fname,origin,cache dir 引數 說明fname origin 檔案的url位址 cache dir train url train path tf.keras.utils.get file...