欠擬合和過擬合簡介

機器/深度學習的基本問題是利用模型對影象、語音、數字等資料進行擬合。學習的目的是對未曾在訓練集合出現的樣本能夠正確**。

在進行如下講解之前先簡單地介紹幾個概念：模型對訓練集資料的誤差稱為經驗誤差，對測試集資料的誤差稱為泛化誤差。模型對訓練集以外樣本的**能力就稱為模型的泛化能力，追求這種泛化能力始終是機器與深度學習的目標。過擬合(overfitting)和欠擬合(underfitting)是導致模型泛化能力不高的兩種常見原因，都是模型學習能力與資料複雜度之間失配的結果。

「欠擬合」的主要體現為：在模型學習能力較弱，而資料複雜度較高的情況出現，此時模型由於學習能力不足，無法學習到資料集中的「一般規律」，因而導致泛化能力弱。

「過擬合」的表現與「欠擬合」的表現恰恰相反，其主要表現為：在模型學習能力過強的情況**現，此時的模型學習能力太強，以至於將訓練集單個樣本自身的特點都能捕捉到，並將其認為是「一般規律」，同樣這種情況也會導致模型泛化能力下降。

欠擬合與過擬合的表現如下圖所示：

過擬合與欠擬合的區別：1）欠擬合在訓練集和測試集上的效能都較差，而過擬合往往能較好地學習訓練集資料的性質，而在測試集上的效能較差；2）在神經網路訓練的過程中，欠擬合主要表現為輸出結果的高偏差，而過擬合主要表現為輸出結果的高方差。

欠擬合出現原因

欠擬合解決方法主要包括如下幾點：

過擬合出現原因

過擬合解決方案

欠擬合和過擬合簡介

過擬合和欠擬合

欠擬合和過擬合

過擬合和欠擬合

欠擬合和過擬合簡介

過擬合和欠擬合

欠擬合和過擬合

過擬合和欠擬合

相關推薦