神經網路反向傳播理解

訓練神經網路的目標是優化代價函式，使得代價函式找到乙個全域性最小值或者區域性最小值。不管使用何種梯度下降演算法（bgd, sgd ，adam），都需要先算出各個引數的梯度。反向傳播的作用：就是快速算出所有引數的偏導數。

求導數通常可以分為兩類，一類是直接用定義，第二類是公式法（包括鏈式法）。

定義法：

定義法求導數存在問題：當引數較多時（如：100萬），計算乙個樣本所有的引數就需要計算 100萬次 c(w+&) ，和一次 c(w) ，計算量太大。所以導數定義法行不通。

若直接將公式展開求導又太複雜，所以選擇用鏈式求導法則求所有引數的偏導。

反向傳播主要依賴於鏈式法則， y是復合函式：

反向傳播正是用到了鏈式法則。

反向傳播的優點在於：盡力用一次前向傳播和一次反向傳播，就同時計算出所有引數的偏導數。反向傳播計算量和前向傳播差不多，並且有效利用前向傳播過程中的計算結果，前向傳播的主要計算量在權重矩陣和input vector的乘法計算，反向傳播則主要是矩陣和input vector 的轉置的乘法計算。例子如下：

前向傳播計算出 q =w.*x , 和 f(q) = q12 + q22+…+qn**2，反向傳播先計算 f 對q 的偏導，再計算 q 對w的偏導，得到f 對w的梯度。利用了前向傳播計算的q。

總結一下：路徑上所有邊相乘，所有路徑相加。

一般情形如下：

兩種求導模式：前向模式求導( forward-mode differentiation) 反向模式求導(reverse-mode differentiation)

前向模式：先求x對y的影響，再求y對z的影響

後向模式：先求y對z的影響，再求x對y的影響。

這樣看起來前向模式求導和反向模式求導，除了求導順序不同，好像沒什麼不同，那為什麼要用反向模式求導，而不用前向模式求導呢？

求導順序不同，求導複雜度也不同

舉例說明：

如果用前向求導模式：關於b向前求導一次

反向模式：

前向模式，一次只能求出 e對b的偏導，而反向模式可以同時求出 e 對a 和b的偏導。使用前向模式求偏導，需要多次才能求出所有引數的偏導，而反向傳播一次就夠了

神經網路反向傳播理解

卷積神經網路反向傳播推導

神經網路學習引入反向傳播

神經網路及反向傳播演算法

神經網路反向傳播理解

卷積神經網路反向傳播推導

神經網路學習引入 反向傳播

神經網路及反向傳播演算法

相關推薦

神經網路學習引入反向傳播