機器學習線性回歸二先驗與正則化

很多接觸過機器學習的同學的人都聽過正則化是為了防止過擬合，很簡單啊，不就是： l(

w)=1

2∑i=

1n(y

i−wx

i)2+

λ||w

||22

(2) (2)l(

w)=1

2∑i=

1n(y

i−wx

i)2+

λ||w

||22

重寫了損失函式，加入的後半部分是正則化項，整個損失函式的目的直觀上理解是既要讓模型擬合訓練樣本，又要防止模型過於複雜出現正則化。

正則化講到這裡就可以結束了，可以拿去用了。但是，這裡面也是有的門道的。

話說統計學有兩大門派，乙個喚作頻率學派，乙個喚作貝葉斯學派。這兩個學派相愛相殺的故事這裡就不展開。跟我們這一章有關係的是，頻率學派認為，模型引數的固定的，這是目前未知而已。我們的任務就是從固定但未知的模型引數隨機生出的訓練樣本中估計出引數。而貝葉斯學派認為，豈止樣本是隨機變數，連模型引數都是服從某種分布的隨機變數！這個就6了。既然引數也是服從某種分布的隨機變數。那我們在估計模型的時候，就要將引數的概率函式考慮進去，我們假設引數服從標準正太分布： p(

w)=∏

jn(w

j|0,

τ2) p(w

)=∏j

n(wj

|0,τ

相應的最大後驗概率估計(map,此時就不是mle了)變成了： ar

gmax

wlog(∏

i=1n

n(yi

|wtx

i,σ2

)p(w

))=∑

i=1n

logn

(yi|

wtxi

,σ2)

+∑jl

ogn(

wj|0

,τ2)

a rg

maxw

log⁡(∏

i=1n

n(yi

|wtx

i,σ2

)p(w

))=∑

i=1n

logn

(yi|

wtxi

,σ2)

+∑jl

ogn(

wj|0

,τ2)

大家講後半部分推算下來就能得到我們的正則化項了，對，就是這麼神奇！

再告訴大家乙個秘密，如果我們假設引數服從拉普拉斯分布，我們將得到另一種正則化項，l1範數，不信你試試！

機器學習線性回歸二先驗與正則化

機器學習正則化回歸與分類辨析

機器學習4 邏輯回歸與線性回歸

機器學習線性回歸

機器學習 線性回歸 二 先驗與正則化

機器學習 正則化 回歸與分類辨析

機器學習4 邏輯回歸與線性回歸

機器學習 線性回歸

相關推薦

機器學習線性回歸二先驗與正則化

機器學習正則化回歸與分類辨析

機器學習線性回歸