RNN系列之三 RNN簡單應用

將以語言模型進行分析。建立語言模型所採用的訓練集是乙個大型的語料庫（corpus）。建立過程中，需要先建立乙個字典，之後將語料庫中每個詞表示為對應的one-hot向量。此外需要額外定義乙個標記eos（end of sentence）表示乙個句子的結尾，也可以將其中的標點符號加入字典後也用one=hot向量表示。對於語料庫中部分（英語）人名、地名等特殊的不包含在字典中的詞彙，可在詞典中加入再用乙個unk（unique token）標記來表示。以讓rnn學習生成新的同風格語言為例。

將標誌化後的訓練集輸入網路中，如下圖所示：

損失函式為：

對乙個以訓練好的模型，需要通過取樣來了解模型學到的東西。

---**andrew ng深度學習課件

第乙個時間步中輸入的a⟨0

⟩和x⟨1

⟩為零向量，依據softmax**出的字典中每乙個詞作為第乙個詞出現的概率，選取乙個詞ŷ ⟨

1⟩作為第二個時間步的輸入。後面與此類似。

RNN系列之三 RNN簡單應用

深度學習之三 RNN

深度學習之三 RNN

RNN應用基於RNN的語言模型

RNN系列之三 RNN簡單應用

深度學習之三 RNN

深度學習之三 RNN

RNN應用 基於RNN的語言模型

相關推薦

RNN應用基於RNN的語言模型