深度學習 驗證集 測試集 區別

2021-08-09 01:42:57 字數 435 閱讀 2544

類別

驗證集測試集

是否被訓練到否否

作用純粹用於調超引數

純粹為了加試以驗證泛化效能

使用次數

多次使用,以不斷調參

僅僅一次使用

缺陷模型在一次次重新手動調參並繼續訓練後所逼近的驗證集,可能只代表一部分非訓練集,導致最終訓練好的模型泛化效能不夠

測試集為了具有泛化代表性,往往資料量比較大,測試一輪要很久,所以往往只取測試集的其中一小部分作為訓練過程中的驗證集

互相轉化

驗證集具有足夠泛化性(一般來說,如果驗證集足夠大到包括大部分非訓練集時,也等於具有足夠泛化性了)

驗證集具有足夠泛化性時,測試集就沒有存在的必要了

模擬校內答辯(如果校內答辯比多校聯合答辯還有泛化性說服力,那麼就沒有必要再搞個多校聯合答辯了)

多校聯合公開答辯

說到底:

深度學習中驗證集與測試集的區別

驗證集 是模型訓練過程中單獨留出的樣本集,它可以用於調整模型的超引數和用於對模型的能力進行初步評估。測試集 用來評估模最終模型的泛化能力。但不能作為調參 選擇特徵等演算法相關的選擇的依據。訓練集用於模型引數,測試集用於估計模型對樣本的泛化誤差,驗證集用於 訓練 模型的超引數。我們知道乙個機器學習模型...

訓練集 驗證集 測試集的區別

深度學習模型的引數分為普通引數和超引數 普通引數 在模型訓練的過程中可以被梯度下降所更新的,也就是訓練集所更新的引數。超引數 比如網路層數 網路節點數 迭代次數 學習率等等,這些引數不在梯度下降的更新範圍內。超引數的設定一般是人工根據驗證集來調。訓練集的作用就是通過梯度下降來調整模型的內部普通引數。...

驗證集和測試集的區別

昨天一直在想驗證集和測試集的問題,越想越迷 問題是這樣的,大部分網路的訓練都是這麼乙個套路 訓練迭代 n 個 epoch 以後就進行一次驗證,然後網路會輸出在驗證集上的 loss 或者其他評價指標。所以如果我直接把測試集作為驗證集,不就可以看到每隔 n 個 epoch 模型在測試集上的表現了嘛?而且...