過擬合和欠擬合及其解決辦法

欠擬合：

欠擬合表示模型在訓練集上的表現比較差，具體表現就是模型在訓練集上的誤差比較大，原因就是模型表現不了資料

欠擬合的緩解辦法：

過擬合：

過擬合表示的是模型在訓練集上變現很好但是測試集上表現不行，可以看下面的吳恩達的課上的這個圖，本來虛線就已經挺好的，但是模型為了在訓練集上取得比較好的變現就產生了乙個彎彎曲曲的分類面，但其實這個分類面反而不能很好的反應資料，那乙個圓圈有可能都是異常點，所以就造成訓練的時候loss很小，但是一測試誤差就很大。

過擬合的緩解辦法

正則化：比如l1和l2正則化，l1正則化是在原來的損失函式後面加上一項

λ 2m

∥w∥\frac\|w\|

2mλ∥w

∥ l2正則化是在原來的損失函式後面加上一項

λ 2m

∥w∥2

\frac\|w\|^

2mλ∥w

∥2直觀上比較好理解為什麼l1和l2正則化會有用：因為過擬合的模型一般都是比較複雜的，引數都是會比較大的，l1和l2正則化相當於加了乙個懲罰項，告訴模型不要太複雜，而引數lamda其實就是用來控制這個懲罰項有多大來進行平衡的。這裡要注意，如果用的是l1正則化，w最終會是稀疏的，也就是說w向量中有很多0，有人說這樣有利於壓縮模型，因為集合中引數均為0，儲存模型所占用的記憶體更少。實際上，雖然l1正則化使模型變得稀疏，卻沒有降低太多儲存記憶體，所以大家越來越傾向於使用l2正則化。

dropout（隨機失活），dropout做的就是以一定概率讓一些節點失活，可以直接理解為以一定概率刪除網路中的某一些節點，比如說下面的這張圖，每一層以50%的概率讓節點失活：

這裡我們介紹一種常見的dropout方法：inverted dropout（反向隨機失活），大概的做法就是我們設定乙個概率keep-prob，這個概率表示保留多少節點，比如說第三層的keep-prob是0.8，那麼我們就保留第三層80%的節點，具體操作我們可以產生乙個向量d，這個向量裡面的值都是0,1，1的個數佔到了整個向量長度的keep-prob，然後我們用這個向量去乘以神經網路某一層的啟用函式，比如說a3=np.multipy(a3,d3),這樣我們就達到了讓一些節點失活的目的，需要注意幾點：

1、每一層都可以設定不用的keep-prob值,你如果覺得某一層不可能是過擬合的原因，你就可以把那一層的keep-prob設定為1，也就是不使用dropout

2、反向隨機失活（inverted dropout）方法通過除以keep-prob，確保最後結果期望值不變

3、我們訓練的時候，每一次遍歷資料集，可能會讓不同的節點失活

4、測試時我們不會使用dropout，因為在測試階段進行**時，我們不期望輸出結果是隨機的，如果測試階段應用dropout函式，**會受到干擾。

過擬合和欠擬合及其解決辦法

過擬合欠擬合及其解決辦法

欠擬合和過擬合定義和解決辦法

過擬合和欠擬合以及相對應的解決辦法

過擬合和欠擬合及其解決辦法

過擬合 欠擬合及其解決辦法

欠擬合和過擬合定義和解決辦法

過擬合和欠擬合以及相對應的解決辦法

相關推薦

過擬合欠擬合及其解決辦法