機器學習梯度下降實驗

什麼是梯度

梯度：梯度的本意是乙個向量，由函式對每個引數的偏導組成，表示某一函式在該點處的方向導數沿著該方向取得最大值，即函式在該點處沿著該方向變化最快，變化率最大。

梯度下降演算法原理

演算法思想：梯度下降是一種非常通用的優化演算法，能夠為大範圍的問題找到最優解。梯度下降的中心思想就是迭代地調整引數從而使損失函式最小化。假設你迷失在山上的迷霧中，你能感覺到的只有你腳下路面的坡度。快速到達山腳的乙個策略就是沿著最陡的方向下坡。這就是梯度下降的做法：通過測量引數向量 θ 相關的損失函式的區域性梯度，並不斷沿著降低梯度的方向調整，直到梯度降為 0 ，達到最小值。

其中 η 為學習率，是 0 到 1 之間的值，是個超引數，需要我們自己來確定大小。

演算法原理：

在傳統機器學習中，損失函式通常為凸函式，假設此時只有乙個引數，則損失函式對引數的梯度即損失函式對引數的導數。如果剛開始引數初始在最優解的左邊，

很明顯，這個時候損失函式對引數的導數是小於 0 的，而學習率是乙個 0 到 1 之間的數，此時按照公式更新引數，初始的引數減去乙個小於 0 的數是變大，也就是在座標軸上往右走，即朝著最優解的方向走。同樣的，如果引數初始在最優解的右邊，

此時按照公式更新，引數將會朝左走，即最優解的方向。所以，不管剛開始引數初始在何位置，按著梯度下降公式不斷更新，引數都會朝著最優解的方向走。

梯度下降演算法流程

隨機初始引數；確定學習率；求出損失函式對引數梯度；按照公式更新引數；重複 3 、 4 直到滿足終止條件（如：損失函式或引數更新變化值小於某個閾值，或者訓練次數達到設定閾值）。

程式設計要求根據提示，使用 python 實現梯度下降演算法，並損失函式最小值時對應的引數theta，theta會返回給外部**，由外部**來判斷theta是否正確。

測試說明

損失函式為：loss=θ²−8θ+17loss=\theta²-8\theta+17loss=θ²−8θ+17

最優引數為：4.0

你的答案跟最優引數的誤差低於0.0001才能通關。

# -*- coding: utf-8 -*-
import numpy as np
import warnings
warnings.filterwarnings(
"ignore"
)def
gradient_descent
(initial_theta,eta=
0.05
,n_iters=
1000
,epslion=1e-
8):'''
梯度下降
:param initial_theta: 引數初始值，型別為float
:param eta: 學習率，型別為float
:param n_iters: 訓練輪數，型別為int
:param epslion: 容忍誤差範圍，型別為float
:return: 訓練後得到的引數
'''#********** begin *********#
theta = initial_theta
i_iter =
0while i_iter < n_iters:
gradient =
2*theta -
8#梯度
last_theta = theta
theta = theta - eta*gradient
if(abs
(theta-last_theta)
:break
i_iter +=
1return theta
#********** end **********#

機器學習 梯度下降實驗

機器學習 梯度下降

機器學習 梯度下降

機器學習 梯度下降

相關推薦

機器學習梯度下降實驗

機器學習梯度下降

機器學習梯度下降

機器學習梯度下降