防止過擬合（二） Dropout

深度學習筆記：欠擬合、過擬合

防止過擬合（一）：正則化

防止過擬合（三）：資料增強

在 2012 年，hinton 等人在其**《improving neural networks by preventing co-adaptation of feature detectors》中使用了 dropout 方法來提高模型效能。dropout通過隨機斷開神經網路之間的連線，減少每次訓練時實際參與計算的模型的參數量，從而減少了模型的實際容量，來防止過擬合。

但是需要注意的是：在測試時，dropout 會恢復所有的連線，保證模型測試時獲得最好的效能。

圖(a)是標準的全連線神經網路，當前節點與前一層的所有輸入節點相連。

圖(b)是新增dropout功能的網路，按照概率隨機斷開神經網路的連線線。圖中虛線代表了取樣結果為斷開的連線線，實線代表了取樣結果不斷開的連線線。

1.可以通過 tf.nn.dropout(x, rate)函式實現某條連線的 dropout 功能，其中rate表示斷開的概率值。

# 新增dropout操作
x = tf.nn.dropout(x, rate=
0.5)

2.也可以將dropout作為乙個網路層使用，在網路中間插入乙個 dropout 層

# 新增dropout層
model.add(layers.dropout(rate=
0.5)
)

為了驗證 dropout 層對網路訓練的影響，我們在維持網路層數等超引數不變的條件下，通過在 5 層的全連線層中間隔插入不同數量的 dropout 層來觀測 dropout 對網路訓練的影響。

從上圖可以看到，在不新增 dropout 層時，網路模型出現了明顯的過擬合現象；隨著 dropout 層的增加，網路模型訓練時的實際容量減少，泛化能力變強。

dropout防止過擬合

l1 l2正則化是通過修改代價函式來實現的，而dropout則是通過修改神經網路本身來實現的，它是在訓練網路時用的一種技巧 trike 它的流程如下假設我們要訓練上圖這個網路，在訓練開始時，我們隨機地刪除一半的隱層單元，視它們為不存在，得到如下的網路保持輸入輸出層不變，按照bp演算法更新上圖...

dropout解決過擬合

原理就是在第一次學習的過程中，隨即忽略一些神經元和神經的鏈結。使得神經網路變得不完整。一次一次。每一次得出的結果不依賴某乙個引數。這樣就解決了過擬合問題。import tensorflow as tf from sklearn.datasets import load digits from skl...

Dropout與過擬合

假設我們要訓練這樣乙個神經網路輸入是x輸出是y，正常的流程是我們首先把x通過網路前向傳播，然後把誤差反向傳播以更新引數讓網路進行學習。使用dropout之後過程變成隨機臨時刪掉網路中一半的隱藏神經元，輸入輸出神經元保持不變下圖中虛線為部分臨時被刪除的神經元把輸入x通過修改後的網路前向傳...

防止過擬合（二） Dropout

dropout防止過擬合

dropout解決過擬合

Dropout與過擬合

相關推薦