訓練集，驗證集，測試集，K折交叉驗證

有了模型後，訓練集就是用來訓練引數的，說準確點，一般是用來梯度下降的。而驗證集基本是在每個epoch完成後，用來測試一下當前模型的準確率。因為驗證集跟訓練集沒有交集，因此這個準確率是可靠的。那麼為啥還需要乙個測試集呢？

這就需要區分一下模型的各種引數了。事實上，對於乙個模型來說，其引數可以分為普通引數和超引數。在不引入強化學習的前提下，那麼普通引數就是可以被梯度下降所更新的，也就是訓練集所更新的引數。另外，還有超引數的概念，比如網路層數、網路節點數、迭代次數、學習率等等，這些引數不在梯度下降的更新範圍內。儘管現在已經有一些演算法可以用來搜尋模型的超引數，但多數情況下我們還是自己人工根據驗證集來調。

那也就是說，從狹義來講，驗證集沒有參與梯度下降的過程，也就是說是沒有經過訓練的；但從廣義上來看，驗證集卻參與了乙個「人工調參」的過程，我們根據驗證集的結果調節了迭代數、調節了學習率等等，使得結果在驗證集上最優。因此，我們也可以認為，驗證集也參與了訓練。

那麼就很明顯了，我們還需要乙個完全沒有經過訓練的集合，那就是測試集，我們既不用測試集梯度下降，也不用它來控制超引數，只是在模型最終訓練完成後，用來測試一下最後準確率。

演算法選擇具有最小泛化誤差的模型作為最終模型，並且在整個訓練集上再次訓練該模型，從而得到最終的模型。

首先它是在驗證階段起作用的，所以k折交叉驗證的作用是選擇模型的超參用，而不是參與訓練決定模型的權重閾值。它是為了防止隨意劃分的驗證集存在分布上的偏差導致誤判，從而選擇了區域性最優的超參，而不是全域性最優。為什麼一些異常檢測，ctr之類的非均衡問題用到這個手段，就是應為樣本不均衡，隨意劃分會導致分布不均，比如所驗證集合裡面就乙個正樣本，那指標就一定是極端的。k折之後可以避免這種情況，便於我們更好的選擇模型超參。

訓練集，驗證集，測試集，K折交叉驗證

訓練集測試集驗證集與交叉驗證

訓練集測試集驗證集與交叉驗證

訓練集驗證集測試集

訓練集，驗證集，測試集，K折交叉驗證

訓練集 測試集 驗證集與交叉驗證

訓練集 測試集 驗證集與交叉驗證

訓練集 驗證集 測試集

相關推薦

訓練集測試集驗證集與交叉驗證

訓練集測試集驗證集與交叉驗證

訓練集驗證集測試集