關於反向傳播的筆記

參考《ml lecture 7: backpropagation》：

假設乙個比較簡單的網路結構如下：

我們取其中一部分做詳細的分析：

對於乙個輸入 $$，它能計算出對應的 loss $c(x;\theta)$，我們如果想要更新引數 $\theta = \$，就要計算 $\nabla_\theta c(\theta)$，即所有的 $\frac, \frac$。

對於上圖，第乙個神經元的三個引數有

其中 $\frac$ 不好算，但是 $\frac, \frac, \frac$ 是很好算的

這其實對於所有的神經元都是一樣的，某個神經元中的求和結果 $z$ 對於 weight 的偏導就是對應的 input（即這條有向邊的起點），對於 bias 的偏導就是 $1$。這就是 forward pass，在引數確定、輸入確定的情況下，可以很快的計算出所有的 $\frac, \frac$。

然後就是比較難的問題，怎麼計算 $\frac$ 呢？

記 $a = \sigma (z)$ 是乙個啟用函式，就有

而對於 $\frac$ 又有

所以計算 $\frac$ 的表示式是這樣的

在輸入確定的情況下 $\sigma ' (z)$ 就也是確定的（相當於乘乙個放縮係數），很明顯能看出一種逆推的關係

其實這時已經能感受到反向傳播的味道了。為了更加易懂，不妨來看看這個網路的最後一層（假設是如下圖的引數，$y_1, y_2$ 是網路的輸出）

那麼就有

其中 $\frac, \frac$ 取決於你的函式 $c$，假設你的函式 $c = \sum_ y_i^2 = y_1^2 + y_2^2$，那麼 $\frac = 2y_1, \frac = 2y_2$，再把網路的輸出，確定的 $y_1, y_2$ 值代入就好了。至於 $\frac = \sigma'(z'), \frac = \sigma'(z'')$ 之前就講過了，相當於乙個確定的放縮係數。

所以，我們就可以從網路的最後一層，往前一層一層地逆推出所有的 $\frac$，這就是 backward pass。

這樣一來，我們經過一次 forward pass 得到了所有的 $\frac, \frac$，又經過一次 backward pass 得到了所有的 $\frac$，兩者相乘就可以得到所有的 $\frac, \frac$，即 $\nabla_\theta c(\theta)$。

關於反向傳播的筆記

反向傳播演算法

彈性反向傳播

反向傳播演算法

關於反向傳播的筆記

反向傳播演算法

彈性反向傳播

反向傳播演算法

相關推薦