逐步理解RNN

逐步理解rnn迴圈神經網路：

先了解一下最基本的單層網路，它的結構如圖：

輸入是x，經過變換wx+b和啟用函式f得到輸出y。

前面狀態輸出會影響後面狀態輸出的情況有下面幾種：

為了建模序列問題，rnn引入了隱狀態h（hidden state）的概念，h可以對序列形的資料提取特徵，接著再轉換為輸出。先從h1的計算開始看：

每一步使用的引數u、w、b都是一樣的，也就是說每個步驟的引數都是共享的，這點非常重要。

依次計算

（使用相同的引數u、w、b）

對h1進行一次變換，得到輸出y1

同樣使用相同的v和c得到y2、y3、y4

模型構造完成，輸入x1，…，xn，輸出y1，…，yn，輸入和輸出序列等長。

時間步time_steps問題的理解：

執行一次call方法，就進行一步轉化，從h0->h1：

cell = tf.nn.rnn_cell.basicrnncell(num_units=128)

呼叫一次call方法

使用tf.nn.dynamic_rnn一次執行多步(引數中用到時間步time_steps):

輸入資料的格式為(batch_size, time_steps, input_size) time_steps為時間步，表示序列本身的長度，長度為10的句子對應的time_steps就等於10，這樣就可以直接輸入x1,...,x10,得到h1,...,h10

outputs, state = tf.nn.dynamic_rnn(cell, inputs, initial_state=initial_state)

得到的outputs就是time_steps步裡所有的輸出。它的形狀為(batch_size, time_steps, cell.output_size)。state是最後一步的隱狀態，它的形狀為(batch_size, cell.state_size)。

堆疊rnncell

單層rnn的能力有限，我們需要多層的rnn。將x輸入第一層rnn的後得到隱層狀態h，這個隱層狀態就相當於第二層rnn的輸入，第二層rnn的隱層狀態又相當於第三層rnn的輸入，以此類推。在tensorflow中，可以使用tf.nn.rnn_cell.multirnncell函式對rnncell進行堆疊

def get_a_cell():

return tf.nn.rnn_cell.basicrnncell(num_units=128) #

每層128個狀態 #

用tf.nn.rnn_cell multirnncell建立3層rnn

cell = tf.nn.rnn_cell.multirnncell([get_a_cell() for _ in range(3)]) # 3

層rnn

逐步理解RNN

BP演算法和RNN 雙向RNN的理解

入門理解RNN 通俗篇

RNN和LSTM GRU的簡單理解

逐步理解RNN

BP演算法和RNN 雙向RNN的理解

入門理解RNN 通俗篇

RNN和LSTM GRU的簡單理解

相關推薦