梯度下降反向傳播啟用函式式什麼東西

梯度下降：是一種優化方法，網路更新引數的公式為：θ=θ−η×∇(θ).j(θ) ，其中η是學習率，∇(θ).j(θ)是損失函式j(θ)的梯度。用於將代價函式降到極小值的最快的一種方式。

梯度下降只是神經網路眾多優化演算法中的一種。其他的還有如adam、momentum等。講解很好的優化演算法文章：

自己待回頭總結下。

反向傳播：計算的是梯度，只是從後往前。衡量神經網路中各層的權重引數對於誤差影響大小。

「前向傳播」求損失，「反向傳播」回傳誤差，反向傳播根據誤差訊號（梯度（偏導值））修正更新每層的權重。

反向傳播的思想其實就是，對於每乙個訓練例項，將它傳入神經網路，計算它的輸出；然後測量網路的輸出誤差（即期望輸出和實際輸出之間的差異），並計算出各層中，上乙個隱藏層中各神經元為該層輸出結果貢獻了多少的誤差；利用引數更新公式w'=w-學習率*梯度。反覆一直從後一層計算到前一層，直到演算法到達初始的輸入層為止。此反向傳遞過程有效地測量網路中所有連線權重的誤差梯度，最後通過在每乙個隱藏層中應用梯度下降演算法來優化該層的引數（反向傳播演算法的名稱也因此而來）。

具體流程：

計算出輸出與標籤間的損失函式值，然後計算其相對於每個神經元的梯度，根據梯度方向更新權值。

（1）將訓練集資料輸入到nn的輸入層，經過隱藏層，最後達到輸出層並輸出結果，這是nn的前向傳播過程；

（2）由於nn的輸出結果與實際結果有誤差，則計算估計值與實際值之間的誤差，並將該誤差從輸出層向隱藏層反向傳播，直至傳播到輸入層；（反向傳播）

（3）在反向傳播的過程中，根據誤差調整各種引數的值；不斷迭代上述過程，直至收斂。（更新引數）

反向傳播也可以看成是儲存值的鏈式求導（cs224n裡，老爺子的概述）

啟用函式(又叫傳遞函式）：以分類為例，就是對wx+b，再外層套了的乙個函式，如sigmoid.(將wx+b的值進一步對映到0,1之間）。將神經網路每層的輸出結果變得非線性化，這樣使得神經網路才能擬合任意函式。另乙個意義：它的存在可以過濾掉一些非重要的資訊（將值要到0），放大更重要的訊號（值變得相對更大）.

梯度下降反向傳播啟用函式式什麼東西

pytorch 梯度下降與反向傳播

反向傳播以及梯度下降法

深度學習梯度下降和反向傳播

梯度下降 反向傳播 啟用函式式什麼東西

pytorch 梯度下降與反向傳播

反向傳播以及梯度下降法

深度學習 梯度下降和反向傳播

相關推薦

梯度下降反向傳播啟用函式式什麼東西

深度學習梯度下降和反向傳播