機器學習系列之最小二乘法

最小二乘法，又稱最小平方法，是機器學習中基礎的演算法之一，它是一種優化演算法，通過最小化誤差的平方來尋找資料的最佳函式匹配。利用最小二乘法可以簡便地求得未知的資料，並使得這些求得的資料與實際資料之間誤差的平方和為最小。在機器學習中，還可以使用最小二乘法來進行曲線擬合。

上圖介紹的上海市長寧區部分房價的資訊，從散點圖可以發現，房子的大小和房價彼此之間有一些依賴關係，由房子大小可以決定房子的**，但是這種關係又是不確定的，這時候我們可以利用統計學中的回歸模型來尋找這兩個變數之間的關係。具體步驟如下：

畫散點圖，直觀判斷；

用近似模型來描述它們的關係，如一元線性模型；

建立回歸模型；

對模型進行引數估計，最小二乘法是這些引數估計的一種常用的方法，這也是本篇博文講述的重點；

討論模型的效果；

為了描述簡單，本篇文章將採用一元線性模型（y=

w0+w

1x）建立回歸模型來介紹最小二乘法。yi

^=w0

+w1x

i（式1

−1）

其中，yi^

是根據回歸模型求得的值，則yi

和yi^

的差就是該模型的誤差。則平方損失函式為： s=

∑i=1

n(yi

−yi^

)2=∑

i=1n

(yi−

w0−w

1xi)

2（式1

−2）

分別對w0,

w1求偏導得： ∂s

∂w0=

−2∑i

=1n(

yi−w

0−w1

xi)（

式1−3

） ∂s

∂w1=

−2∑i

=1n(

yi−w

0−w1

xi)(

−xi)

（式1−

4）根據我們的數學知識，函式的極值點為偏導數為0的點。即 ∂s

∂w0=

0（式1

−5）

∂s∂w

1=0（

式1−6

）亦即 nw0

+∑i=

1n(x

i)w1

=∑i=

1nyi

（式1−

7） ∑

i=1n

(xi)

w0+(

∑i=1

nx2i

)w1)

=∑i=

1n(x

iyi)

（式1−

8）對式1-7和式1-8求解得： w0

=∑ni

=1yi

n−w1

∑ni=

1xin

（式1−

9） w

1=[n

∑ni=

1xiy

i−(∑

ni=1

xi∑n

i=1y

i)n∑

ni=1

x2i−

(∑ni

=1xi

)2（式

1−10）

此時,把w0

,w1 帶入式1-1，就是我們要求的回歸模型。

機器學習系列之最小二乘法

機器學習經典演算法之最小二乘法

機器學習經典演算法之最小二乘法

線性回歸之最小二乘法

機器學習系列之最小二乘法

機器學習經典演算法之 最小二乘法

機器學習經典演算法之 最小二乘法

線性回歸之最小二乘法

相關推薦

機器學習經典演算法之最小二乘法

機器學習經典演算法之最小二乘法