迴圈神經網路（RNN）筆記總結

-------本文僅為學習筆記，不做任何商業用途-------

首先對於乙個簡單的迴圈神經網路如下所示，它由輸入層、隱藏層以及輸出層組成。

由上圖我們可以看到，rnn與傳統神經網路有很大的不同，它的隱藏層神經單元a不僅與輸入和輸出有關，而且自身也存在迴路，說明上乙個時刻的網路狀態資訊會對下一時刻的網路狀態產生影響。將上圖展開，得到如下圖所示：

其動態圖如下圖：

其數學表示式為：

h t=

ϕ(wx

hxt+

whhh

t−1+

b)h_t= \phi(w_x_t+w_h_+b)

ht=ϕ(

wxh

xt+

whh

ht−1

+b)

這裡的wxh

w_wx

h為輸入層與隱藏層之間的權重，whh

w_wh

h為隱藏層與輸出層之間的權重，ϕ

\phi

ϕ為啟用函式。值得注意的是，所有時刻的權重矩陣都是共享的。

這是由於在神經元a中的運算和變數在不同時刻是相同的，因此迴圈神經網路理論上可以看作是同一神經網路被無限複製的結果,極大的降低了計算量。迴圈神經網路在不同的位置共享引數，從而使有限的引數處理任意長度的序列。如果我們在每個時間點都有乙個單獨的引數，我們不但不能泛化到訓練時沒有見過序列長度，也不能再時間上共享不同序列長度和不同位置的統計強度。

[1][2]

[3][4]

[5]

迴圈神經網路（RNN）筆記總結

RNN迴圈神經網路

迴圈神經網路 RNN

RNN迴圈神經網路

迴圈神經網路（RNN）筆記總結

RNN迴圈神經網路

迴圈神經網路 RNN

RNN迴圈神經網路

相關推薦