動手學深度學習筆記2

part1 模型選擇1 誤差與資料集

● 訓練誤差(training error)：模型在訓練集上表現出的誤差。

● 泛化誤差(generalization error)：在任意乙個測試資料樣本上表現出的誤差的期望。

舉個栗子，訓練誤差就是做往屆試卷（訓練）的錯誤率，泛化誤差則可以通過真正參加考試（測試）時的答題錯誤率來近似。機器學習模型應該關注降低泛化誤差。

● 驗證集(validation set): 預留一部分在訓練資料集和測試資料集以外的資料來進行模型選擇。這部分資料被稱為驗證資料集，簡稱驗證集。

● k折交叉驗證(k-fold cross-validation): 將原始訓練資料集分割成k個不重複的子資料集，然後做k次模型訓練和驗證。每一次使用乙個子資料集驗證模型，並使用其他k-1個子資料集來訓練模型。在這k次訓練和驗證中，每次用來驗證模型的子資料集都不同，最後，我們對k次訓練誤差和驗證誤差分別求平均。2 過擬合與欠擬合

● 欠擬合(underfitting): 模型無法得到較低的訓練誤差

● 過擬合(overfitting): 模型的訓練誤差遠小於它在測試資料集上的誤差

● 模型複雜度● 訓練資料集大小：影響欠擬合和過擬合的另乙個重要因素時訓練資料集的大小。一般來說，如果訓練資料集中樣本數過少，特別是比模型引數更少時，過擬合更容易發生。此外，泛化誤差不會隨訓練資料集裡的樣本數量增加而增大。因此，在計算資源允許的範圍之內，我們通常希望訓練資料集大一些，特別是在模型複雜度較高時。

動手學深度學習筆記2

動手學深度學習學習筆記（2）

筆記動手學深度學習

深度學習動手學深度學習筆記 12

動手學深度學習筆記2

動手學深度學習學習筆記（2）

筆記 動手學深度學習

深度學習 動手學深度學習筆記 12

相關推薦

筆記動手學深度學習

深度學習動手學深度學習筆記 12