經驗誤差與過擬合

1.經驗誤差

「誤差」是學習器的實際**輸出與樣本的真實輸出之間的差異；比如一組資料 1,2,4,5.使用閾值3，將其分為兩類。假設學習器的分類結果為 1和 2，4, 5 。但是實際的結果為1,2,和4,5，分錯的2就是誤差。

那什麼是經驗誤差呢？沒啥神秘，其實就是在訓練集的誤差，也叫訓練誤差。相對於經驗誤差的，還有大家經常遇到的泛化誤差，泛化誤差是在新樣本（測試集）的誤差。

顯然，我們都希望泛化誤差小的學習器。然而，我們事先是不知道新樣本是什麼的樣的，實際上能做的就是使學習器的經驗誤差盡量小。大多數情況，我們可以學的乙個經驗誤差很小、在訓練集上表現良好的學習器。

如果對所有訓練集都分類正確，即分類錯誤率為0，但這樣的學習器好嗎？

2.過擬合

我們實際希望的是在新樣本上表現的很好的學習器。為了達到這個目的，應該為從訓練樣本中盡可能學出是適用於所有潛在樣本的「普遍規律」，就相當於支援向量機分類時尋找到好的支援向量，這樣才能在遇到新樣本時做出正確的判別。然而，當學習器把訓練樣本學的「太好」了的時候，很可能已經把訓練樣本自身的一些特點當作了所有潛在樣本都會具有的一般性質，這會導致泛化效能下降。這種現象在機器學習中稱為「過擬合」。與過擬合相對的是「欠擬合」，這是指對訓練樣本的一般性質尚未學好。圖1，給出關於過擬合和欠擬合的乙個便於直接理解的模擬。

經驗誤差與過擬合

pytorch 誤差與過擬合

過擬合，欠擬合，偏差，誤差，正則化

欠擬合與過擬合

經驗誤差與過擬合

pytorch 誤差與過擬合

過擬合，欠擬合，偏差，誤差，正則化

欠擬合與過擬合

相關推薦