彈性反向傳播

正常使用的反向傳播演算法有兩個缺點待解決，其一為學習過程中學習率的選擇較難，一旦學習率選擇不當會造成學習效果不好；其二為反向傳播演算法的梯度瀰散作用，即距離輸出層越遠的神經元學習的速度越慢。

martin riedmiller也因此提出了彈性反向傳播演算法（rprop）

反向傳播演算法中的學習率為使用者提前設定的固定的η，並在整個網路中使用單一的η，因此就會出現學習率選擇的問題，而在rprop中，每乙個可優化的權重都對應著乙個單獨的η，不同的權重的學習率不同，並且這些學習率並不是由使用者指定，而是由程式自動的設定，這些學習率在程式執行過程中也並不是靜態不變的，而是每乙個學習時間點學習率都在不斷地更新，即

在一般的反向傳播演算法中，學習過程中權重的改變量是由誤差函式對該權重的偏導（即梯度）所決定，直觀上很有道理，however,we incorporate every jagged feature of the error su***ce,it is at least questionable.這句看不懂，總之有問題就是了啦啦啦而在rprop中，權重的變化量，因此誤差函式的梯度並不影響權重的變化值，在rprop中梯度僅僅影響權重變化值的符號，即影響權重變化的方向。

綜上，我們已經知道了訓練過程中權重的改變量直接等於每個權重對應的學習率，而權重的改變量的符號則取決於誤差函式的梯度的符號，誤差函式得梯度只決定權值更新的方向，不決定權值更新的強度，如果誤差函式的梯度為正，則我們就需要降低相應的權重，可以使，如果梯度為負數，則就應該增大相應的權重來使誤差函式逼近最小值，如下式所示：

至此已經明確了權重如何更新，接下來說明一下學習率如何更新。

此時首先應當考慮一下如何t和（t-1）兩個時間點的梯度的符號會如何變化，總共有兩種情況。

如果（t-1）和t兩個時間點誤差函式的梯度符號不同，說明在t時我們已經越過了最小值，說明上一次權值的更新步跨太大，則就應當比

如下式所示：

彈性反向傳播

反向傳播演算法

反向傳播演算法

反向傳播演算法

相關推薦