關於Keras公用資料集的獲取和使用

keras是tensorflow2.0的核心高階api，其內建了一些常用的公共資料集，給開發者使用。

以波士頓房價資料集為例，其涵蓋了麻省波士頓的506個不同郊區的房屋資料。有404條訓練資料集和102條測試資料集。

每條資料有14個字段，包含13個屬性和乙個房價資料

獲取波士頓房價資料集：

1
import
tensorflow as tf
2 boston_housing = tf.keras.datasets.boston_housing #
34 (train_x,train_y),(test_x,test_y) = boston_housing.load_data() #
獲取訓練集和測試機

資料拿到了，就順便看看各個屬性和房價之前的關係吧，這裡對每個屬性和房價的關係進行視覺化：

1
import
tensorflow as tf
2import
matplotlib.pyplot as plt
3 boston_housing = tf.keras.datasets.boston_housing #
45 (train_x,train_y),(_,_) = boston_housing.load_data(test_split=0) #
獲取訓練集
67 title = ['
crim
', '
zn', '
indus
', '
chas
', '
nox', '
rm', '
age', '
dis',8
'rad
', '
tax', '
ptratio
', '
b-1000
', '
lstat']
9 plt.figure(figsize = (12,12)) #
設定畫布大小為12*12英吋
1011
for i in
range(len(title)):
12 plt.subplot(4,4,i+1) #
繪製 4*4 子圖
13 plt.scatter(train_x[:,i], train_y) #
繪製散點圖
1415 plt.xlabel(title[i]) #
x軸標籤
16 plt.ylabel("
price($1000)'s
") #
y軸標籤
17 plt.title(str(i+1)+'
.'+title[i]+'
- price
') #
設定子圖標題
1819 plt.tight_layout()#
使標題座標軸不重疊
20 plt.suptitle('
各個屬性與房價的關係
', x=0.5, y=1.02, fontsize=20) #
全域性標題
21 plt.show()

來看看結果：

然後就可以使用這些資料來進行後續的資料清洗、模型訓練和結果評價了。

Keras 資料集介紹

基本的使用情況差不多介紹的差不多了，我也是邊學習邊寫部落格，其中難免有很多理解錯誤的地方或者理解不到位的地方，還請各位博友多多指點。python view plain copy print?keras.datasets.cifar10 keras.datasets.cifar10cifar10資料集...

Keras打亂輸入資料集

實驗資料集 2096 351，第一列為y，餘下350列為特徵x 分割輸入x和輸出y x dataset 1 351 y dataset 0 打亂訓練集 index i for i in range len dataset 下面這種寫法也可以 index np.arange len dataset n...

Keras資料集匯入問題

keras 中文文件當採用文件推薦方法即如下匯入資料集時 from keras.datasets import fashion mnist x train,y train x test,y test fashion mnist.load data 如本例的fashion mnist 時尚物品資料...

關於Keras公用資料集的獲取和使用

Keras 資料集介紹

Keras打亂輸入資料集

Keras資料集匯入問題

相關推薦