訓練集 驗證集 測試集

2021-09-29 13:46:51 字數 606 閱讀 7038

小白最近在學棧式降噪自編碼(sdae),過程有三部分:自編碼器(ae)的無監督訓練、有監督微調、最終正確率的驗證。因此需要三部分資料:無標籤資料集、少部分有標籤的資料集用來微調、大量有標籤的資料集用來驗證正確率。

一些部落格及課本中用的資料集是mnist資料集,但剛才查了下mnist資料集總體上分為兩部分:training set(training set images+training set labels)和test set(test set images+test set labels),也就是說sdae的前兩部分用的同乙個資料集,初學者有點頭大~~

在sdae中:

訓練集:完成對模型引數的訓練

驗證集:有監督微調(就是把模型從輸入到最終輸出串起來整體進行訓練,得到最終想要的輸出資料形式(標籤型別的)),其實也就是高階版的訓練

測試集:確定訓練好的模型的正確率

資料集的分類主要看演算法吧,有監督的演算法(比如cnn),分為兩部分就好啦(訓練+測試),像sdae這種無監督的演算法就需要三部分資料集

小白的第一篇部落格,主要是給自己做的筆記,有問題的話隨便指出哈,反正我是不會改的哈哈哈哈哈~

訓練集 驗證集 測試集

訓練集loss 驗證集loss 測試集loss 乙個好的網路,二者的差距應該是很低的。但一般情況下因為網路不可避免地存在一定程度上的過擬合,所以肯定是train loss低於test lost,但如果低太多,就得考慮是過擬合的問題還是因為樣本的特徵空間不統一的問題。驗證集基本是在每個epoch完成後...

訓練集,驗證集,測試集

普通引數就是可以被梯度下降所更新的,也就是訓練集所更新的引數。超引數是指訓練開始之前設定的引數,不在梯度下降的更新範圍內,比如網路層數 網路節點數 迭代次數 學習率等等 1.訓練集 確定模型後,用於訓練普通引數 2.驗證集 交叉驗證集cv 驗證集在每個epoch訓練完成後,用來測試一下當前模型的準確...

訓練集 測試集 驗證集

訓練集 用來訓練和擬合模型。驗證集 當通過訓練集訓練出多個模型後,使用驗證集資料糾偏或比較 測試集 模型泛化能力的考量。泛化 對未知資料的 能力 from sklearn.model selection import train test split import numpy as np from ...