LSTM學習筆記

兩層的rnn：

y1 = rnn1.step(x)
y = rnn2.step(y1)

長短期記憶體網路–通常只稱為「lstm」 - 是一種特殊的rnn，能夠學習長期依賴性。lstm可以選擇性忘記不重要的資訊，只關聯重要的資訊。所有的遞迴神經網路都有乙個神經網路的重複模組鏈的形式。在lstm中，這個重複模組有4層。

lstm的第二步是判斷要在細胞狀態中儲存什麼新的資訊。由兩部分組成，包括乙個叫做「input gate layer」的sigmoid層決定需要更新什麼內容；和乙個tanh層建立需要被加入現在state的結果向量。

lstm的第三步是根據自身input以及要不要忘記衡量自己的價值，最終傳遞到output layer，決定輸出。

對於不確定性很高的內容（語音識別、手寫識別），lstm非常重要。

介紹部落格：傳送門

訓練**部落格：傳送門

bilstm是bi-directional long short-term memory的縮寫，是由前向lstm與後向lstm組合而成。lstm模型可以捕捉到較長距離的依賴關係，但是無法捕捉反向的語義依賴（e.g. 」這個餐廳髒得不行「，「不行」修飾的是「髒」）。bi-lstm可以解決這個問題。

對「我愛中國」進行編碼：

介紹與計算部落格：傳送門