第10課優化神經網路如何防止過擬合

任何機器學習模型，包括神經網路都可能存在過擬合（overfit）問題。下面用一張圖來說明：

上圖中，分別用三個模型來擬合實際的樣本點（紅色 x 表示樣本）。第乙個模型是一條直線，模型簡單，但是**值與樣本 label 差別較大，這種情況稱之為欠擬合（underfit）。第三個模型是乙個高階多項式，模型過於複雜，雖然**值與樣本 label 完全吻合，但是該模型在訓練樣本之外的資料上擬合效果可能很差，該模型可能把雜訊也學習了。這種情況稱之為過擬合（overfit），即模型過於擬合訓練樣本的資料而泛化能力很差。第二個模型是二次曲線，模型複雜度中等，既能對訓練樣本有較好的擬合效果，也能保證有不錯的泛化能力。這是我們構建神經網路模型希望得到的模型。

欠擬合和過擬合分別對應著高偏差（high bias）和高方差（high variance）。偏差度量了學習演算法的期望**與真實結果的偏離程度，刻畫描述了演算法本身對資料的擬合能力，也就是訓練資料的樣本與訓練出來的模型的匹配程度；方差度量了訓練集的變化導致學習性