關於梯度下降

什麼是梯度下降

簡單地來說，多元函式的導數(derivative)就是梯度(gradient)，分別對每個變數進行微分，然後用逗號分割開，梯度是用括號包括起來，說明梯度其實乙個向量，我們說損失函式l的梯度為：

我們知道導數就是變化率。梯度是向量，和引數維度一樣。

總結梯度下降這一目前機器學習、深度學習解決最優化問題的演算法中，最核心、應用最廣的方法。所謂梯度下降，是一種基於搜尋的最優化方法，其作用是用來對原始模型的損失函式進行優化，找到使損失函式（區域性）最小的引數。

首先對梯度下降有乙個整體的印象：梯度是向量，是多元函式的導數，指向誤差值增加最快的方向。我們沿著梯度的反方向進行線性搜尋，從而減少誤差值，是為梯度下降。然後我們通過「下山」這樣的模擬場景，以及嚴謹的資料公式推導深刻理解了梯度下降演算法，並引出了學習率的概念。最後我們給出了梯度下降方法的不足和改進方法。

關於梯度下降

關於梯度下降

梯度下降隨機梯度下降批梯度下降

梯度下降隨機梯度下降和批量梯度下降

關於梯度下降

關於梯度下降

梯度下降 隨機梯度下降 批梯度下降

梯度下降 隨機梯度下降和批量梯度下降

相關推薦

梯度下降隨機梯度下降批梯度下降

梯度下降隨機梯度下降和批量梯度下降