關於DBN的理解

關於dbn我一直有以下三個問題：

1.什麼是complementary priors？

2.為什麼說rbm展開後可以當成sigmoid belief network with tied parameters呢？

3.為什麼greedy layerwise training可以把dbn的每層當成rbm來訓練呢？

經過這幾天的冥思苦想，我得出來了一些對於我個人來說比較可以接受的解釋，這是我第一次寫博文，忘各位大大多多指教，回到正題，讓我來解釋下我個人認知中的complementary priors，這就要從markov chain開始說起了，眾所周知，markov chain具有以下性質：

在符合上述的條件下markov chain 是有唯一的平衡分布的，一旦markov chain收斂到平衡分布的時候，會滿足細節平衡原則（detailed balance）：

其實就是說該markov chain在收斂到平衡分布時是可逆的（reversible），這就是complementarypriors的基本理念了，大家有可能會困惑，這個和dbn有什麼關係嗎？我可以肯定的說，是有的，其實回過頭來看一看complementary priors 就是為了解決layered directed graphical model中inference難的問題，換一種說法，就是因為某些訓練法具有complementarypriors的特性所以才被選上了。好了，廢話不多說，我們來看一看為什麼complementary priors可以使得inference容易了，接下來又是啦~

接下來就是重頭戲了，我們其實可以把圖右邊的網路看成是markov chain的展開（unroll），也就是說每一層表示乙個狀態，而箭頭就是狀態轉換的方向。（注意箭頭方向！！）

當markov chain 收斂到平衡分布的時候根據細節平衡法則，正轉移的發生率等於逆轉移的發生率，再結合上面的內容，其實就是說只要讓markov chain 以相反的方向執行就可以輕鬆的進行inference了，就如同上面說的一樣，complementary prior 其實就是markov chain的平衡分布。

其實就是block gibbs sampling的每個狀態展開而已，箭頭的方向的話和上面說的是乙個原理，箭頭向下就是從rbm的隱層開始取樣，箭頭向上就是從可見層開始取樣，僅此而已，不過這裡有個點是很重要的，也就是可以推出rbm可以看成是具有complementary prior的，這樣我們最後的乙個問題其實也因此開始變得明了起來了。

接下來又是一堆的圖了~

逐層按rbm訓練雖然可以提高dbn似然函式的lower bound但是這個不是我的這篇博文的重點，大家可以仔細看看上面這兩個圖，你們會發現乙個有趣的事情，其實逐層訓練是這樣的，訓練乙個rbm至平衡態，然後對rbm做一次展開變成上圖的樣子，這樣我們就的到了乙個已經訓練好的一層sigmoid belief network with tied parameters和乙個rbm，這個新產生的rbm的可見層是我們剛訓練好的rbm的隱層，然後再訓練我們新得到的rbm然後再展開，如此往復，我們就得到了多層的sigmoid belief network with tied parameters這樣我們就達到我們一開始的目的了，如何有效的訓練乙個directed graphical model，至於dbn最頂上的那個聯想記憶層其實也可以理解為展開後沒訓練的rbm（純屬個人看法），對了，順便提一提，展開一次的意思是給定隱層對可見層進行抽樣，然後產生了新的可見層，這也是為什麼一次展開後上面的那部分沒箭頭的原因，也可以說成是半步的block gibbs sampling。

mail：[email protected]

關於DBN的理解

DBM 和 DBN 的區別

關於this的理解

dbn中的wake sleep演算法是如何調優的？

關於DBN的理解

DBM 和 DBN 的區別

關於this的理解

dbn中的wake sleep演算法是如何調優的？

相關推薦