關於Keras公用資料集的獲取和使用

2022-05-13 14:27:08 字數 1941 閱讀 9431

keras是tensorflow2.0的核心高階api,其內建了一些常用的公共資料集,給開發者使用。

以波士頓房價資料集為例,其涵蓋了麻省波士頓的506個不同郊區的房屋資料。有404條訓練資料集和102條測試資料集。

每條資料有14個字段,包含13個屬性和乙個房價資料

獲取波士頓房價資料集:

1

import

tensorflow as tf

2 boston_housing = tf.keras.datasets.boston_housing #

34 (train_x,train_y),(test_x,test_y) = boston_housing.load_data() #

獲取訓練集和測試機

資料拿到了,就順便看看各個屬性和房價之前的關係吧,這裡對每個屬性和房價的關係進行視覺化:

1

import

tensorflow as tf

2import

matplotlib.pyplot as plt

3 boston_housing = tf.keras.datasets.boston_housing #

45 (train_x,train_y),(_,_) = boston_housing.load_data(test_split=0) #

獲取訓練集

67 title = ['

crim

', '

zn', '

indus

', '

chas

', '

nox', '

rm', '

age', '

dis',8

'rad

', '

tax', '

ptratio

', '

b-1000

', '

lstat']

9 plt.figure(figsize = (12,12)) #

設定畫布大小為12*12英吋

1011

for i in

range(len(title)):

12 plt.subplot(4,4,i+1) #

繪製 4*4 子圖

13 plt.scatter(train_x[:,i], train_y) #

繪製散點圖

1415 plt.xlabel(title[i]) #

x軸標籤

16 plt.ylabel("

price($1000)'s

") #

y軸標籤

17 plt.title(str(i+1)+'

.'+title[i]+'

- price

') #

設定子圖標題

1819 plt.tight_layout()#

使標題座標軸不重疊

20 plt.suptitle('

各個屬性與房價的關係

', x=0.5, y=1.02, fontsize=20) #

全域性標題

21 plt.show()

來看看結果:

然後就可以使用這些資料來進行後續的資料清洗、模型訓練和結果評價了。

Keras 資料集介紹

基本的使用情況差不多介紹的差不多了,我也是邊學習邊寫部落格,其中難免有很多理解錯誤的地方或者理解不到位的地方,還請各位博友多多指點。python view plain copy print?keras.datasets.cifar10 keras.datasets.cifar10cifar10資料集...

Keras打亂輸入資料集

實驗資料集 2096 351,第一列為y,餘下350列為特徵x 分割輸入x和輸出y x dataset 1 351 y dataset 0 打亂訓練集 index i for i in range len dataset 下面這種寫法也可以 index np.arange len dataset n...

Keras資料集匯入問題

keras 中文文件 當採用文件推薦方法即如下 匯入資料集時 from keras.datasets import fashion mnist x train,y train x test,y test fashion mnist.load data 如本例的fashion mnist 時尚物品資料...