最小二乘法

2021-09-12 16:35:20 字數 1325 閱讀 2159

最小二乘法小結

以最簡單的線性回歸為例:

損失函式:

j (θ

0,θ1

,..θ

n)=1

2m∑j

=0m(

hθ(x

(j))

−y(j

))

2j(\theta_0,\theta_1,..\theta_n) = \frac\sum_^m (h_\theta(x^)-y^)^2

j(θ0​,

θ1​,

..θn

​)=2

m1​∑

j=0m

​(hθ

​(x(

j))−

y(j)

)2使用最小二乘法使得j最小的引數

θ

\theta

θ,最小二乘法的代數法解法

求偏導 使得偏導式為0,通過解方程組即可

最小二乘法的矩陣法解法

根據上篇梯度下降得到:

∂ ∂θ

j(θ)

=xt(

xθ−y

)\fracj(\theta)=x^t(x\theta-y)

∂θ∂​j(

θ)=x

t(xθ

−y)令:

∂ ∂θ

j(θ)

=xt(

xθ−y

)=

0\fracj(\theta)=x^t(x\theta-y)=0

∂θ∂​j(

θ)=x

t(xθ

−y)=

0得出:

θ =(

xtx)

−1xt

y\theta=(x^tx)^x^ty

θ=(xtx

)−1x

ty便可得出

θ

\theta

θ最小二乘法的侷限性和使用場景

首先,最小二乘法需要計算(xt

x)

(x^tx)

(xtx

)的逆矩陣,有可能不存在,當然這可以通過對樣本資料進行整理,去掉冗餘特徵,讓其行列式不為0.然後繼續使用最小二乘法。

第二,當樣本特徵數量n非常大的時候,計算(xt

x)

(x^tx)

(xtx

)(n*n)的逆矩陣是非常大的工作,如果沒有很多的分布式大資料計算資源,建議超過10000個特徵就用迭代吧,或者通過主成分分析降低特徵的維度後再用最小二乘法。

第三,如果擬合函式不是線性的,這是無法用最小二乘法,需要通過一些技巧轉化為線性才能使用,此時梯度下降仍然可以使用。

最小二乘法

include stdafx.h include include const int n 2 const int m 5 int sgn double x void lss double g n 1 int xm,int xn,double x m double p,double w m lss函式...

最小二乘法

在研究兩個變數之間的關係時,可以用回歸分析的方法進行分析。當確定了描述兩個變數之間的回歸模型後,就可以使用最小二乘法估計模型中的引數,進而建立經驗方程.簡單地說,最小二乘的思想就是要使得觀測點和估計點的距離的平方和達到最小.這裡的 二乘 指的是用平方來度量觀測點與估計點的遠近 在古漢語中 平方 稱為...

最小二乘法

最小二乘法 least squares analysis 是一種 數學 優化 技術,它通過 最小化 誤差 的平方和找到一組資料的最佳 函式 匹配。最小二乘法是用最簡的方法求得一些絕對不可知的真值,而令誤差平方之和為最小。最小二乘法通常用於 曲線擬合 least squares fitting 這裡有...