lstm輸出輸出和引數你懂了嗎

2021-09-12 11:54:50 字數 754 閱讀 3762

最近在做乙個nlp的練習賽,把lstm重新徹底溫習了一遍。把以前很多沒搞懂的東西重新倒騰了一遍,收穫真的很多,但是由於知識點較多,所以寫一篇部落格來記錄。

本文絕多數及內容參考自:

但是本文不會講一下很基礎的東西,只會講一些很擾人的東西。

這個問題也困擾了我很久,後來終於明白了,很多資料都沒有在這個地方做詳細的解釋,那就是 lstm 的 cell 裡面的 num_units 該怎麼理解,其實也是很簡單,看看下圖:

另外幾個需要注意的地方:

from: zack

推薦一篇博文,是講lstm中的引數個數是怎麼計算的

(博主注:很重要)

說明:上面畫紅框的地方,如想輸出如上的三維矩陣,需要指明引數:return_sequences=true

參考:

單層LSTM和多層LSTM的輸入與輸出

rnn結構 對應的 為 中沒寫偏置 上圖是單層lstm的輸入輸出結構圖。其實它是由乙個lstm單元的乙個展開,如下圖所示 所以從左到右的每個lstm block只是對應乙個時序中的不同的步。在第乙個圖中,輸入的時序特徵有s個,長度記作 seq len,每個特徵是乙個c維的向量,長度記作 input ...

C 值引數 引用引數和輸出引數

一 值引數 在使用引數時,是把乙個值傳遞給函式使用的乙個變數。對函式中此變數的任何修改都不會影響函式呼叫中指定的引數。由於函式只有乙個返回值,不能用作引數的多個變數值 二 引用引數 即函式處理的變數與函式呼叫中使用的變數相同,而不僅僅是值相同的變數。因此,對這個變數的任何改變都會影響用作引數的變數值...

資料結構你真的懂了嗎? 陣列和廣義表篇

串 串 string 是零個或多個字元組成的有限序列。長度為零的串稱為空串 empty string 它不包含任何字元。通常將僅由乙個或多個空格組成的串稱為空白串 blank string 注意 空串和空白串的不同,例如 和 分別表示長度為1的空白串和長度為0的空串。串的表示和實現 1.定長順序儲存...