訓練集驗證集測試集

小白最近在學棧式降噪自編碼（sdae），過程有三部分：自編碼器（ae）的無監督訓練、有監督微調、最終正確率的驗證。因此需要三部分資料：無標籤資料集、少部分有標籤的資料集用來微調、大量有標籤的資料集用來驗證正確率。

一些部落格及課本中用的資料集是mnist資料集，但剛才查了下mnist資料集總體上分為兩部分：training set（training set images+training set labels）和test set（test set images+test set labels），也就是說sdae的前兩部分用的同乙個資料集，初學者有點頭大~~

在sdae中：

訓練集：完成對模型引數的訓練

驗證集：有監督微調（就是把模型從輸入到最終輸出串起來整體進行訓練，得到最終想要的輸出資料形式（標籤型別的）），其實也就是高階版的訓練

測試集：確定訓練好的模型的正確率

資料集的分類主要看演算法吧，有監督的演算法（比如cnn），分為兩部分就好啦（訓練+測試），像sdae這種無監督的演算法就需要三部分資料集

小白的第一篇部落格，主要是給自己做的筆記，有問題的話隨便指出哈，反正我是不會改的哈哈哈哈哈~

訓練集驗證集測試集

訓練集驗證集測試集

訓練集，驗證集，測試集

訓練集測試集驗證集

訓練集 驗證集 測試集

訓練集 驗證集 測試集

訓練集，驗證集，測試集

訓練集 測試集 驗證集

相關推薦

訓練集驗證集測試集

訓練集驗證集測試集

訓練集測試集驗證集