機器學習最小二乘

大家可以隨意搜尋一下，相關的文章很多。長篇大論的不少，剛入門的朋友一看到那些公式可能就看不下去了。比如下面的解釋：

毫無疑問，這樣的解釋是專業的，嚴謹的。事實上，這是深度學習聖經裡的解釋。我並沒有詆毀大師的意思，只是覺得用乙個具體的例子來說明，可能會讓讀者更加容易理解。

小明是跑運輸的，跑1公里需要6塊，跑2公里需要5塊（那段時間剛好油價跌了），跑3公里需要7塊，跑4公里需要10塊，請問跑5公里需要多少塊？如果我們有初中數學基礎，應該會自然而然地想到用線性方程組來做：

這裡假定x是公里數，y是運輸成本（β1和β2是要求的係數）。我們把上面的一組資料代入得到這麼幾個方程：

如果存在這樣的β1和β2，讓所有的資料（x，y）=（1,6），（2,5），（3,7），（4，10）都能滿足的話，那麼解答就很簡單了，β1+5β2就是5公里的成本，對吧。

但遺憾的是，這樣的β1和β2是不存在的，上面的方程組很容易，你可以把前面兩個解出來得到一組β1和β2，後面兩個也解出來同樣得到一組β1和β2。這兩組β1和β2是不一樣的。

形象地說，就是你找不到一條直線，穿過所有的點，因為他們不在一條直線上。如下圖：

可是現實生活中，我們就希望能找到一條直線，雖然不能滿足所有條件，但能近似地表示這個趨勢，或者說，能近似地知道5公里的運輸成本，這也是有意義的。

其實最小二乘法也是這樣，要盡全力讓這條直線最接近這些點，那麼問題來了，怎麼才叫做最接近呢？直覺告訴我們，這條直線在所有資料點中間穿過，讓這些點到這條直線的誤差之和越小越好。這裡我們用方差來算更客觀。也就是說，把每個點到直線的誤差平方加起來：

如果上面的四個方程都能滿足，那麼s的值顯然為0，這是最完美的，但如果做不到完美，我們就讓這個s越小越好）

接下來的問題就是，如何讓這個s變得最小。這裡有乙個概念，就是求偏導數。這裡我想提一下，在培訓的過程中，我發現機器學習的數學基礎課程當中，微積分是大家印象最深刻的，而且也最容易理解：比如導數就是求變化率，而偏導數則是當變數超過乙個的時候，對其中乙個變數求變化率。如果這個概念也忘了，可以參考我在深度學習回答裡那個王小二賣豬的例子。這裡就不細講了：深度學習如何入門？

要讓s取得最小值（或最大值，但顯然這個函式沒有最大值，自己琢磨一下），那麼s對於β1和β2分別求偏導結果為0，用乙個直觀的圖來表示：

我們看到這條曲線，前半部分是呈下降的趨勢，也就是變化率（導數）為負的，後半部分呈上公升的趨勢，也就是變化率（導數）為正，那麼分界點的導數為0，也就是取得最小值的地方。這是乙個變數的情況，對於多個變數的情況，要讓s取得最小值，那最好是對β1和β2分別求導（對β1求導的時候，把β2當常量所以叫求偏導），值為0：

看到這個我們就熟悉了，兩個變數，剛好有兩個方程式，初中學過，那麼很容易得出：

其實也就意味著：

這個函式也就是我們要的直線，這條直線雖然不能把那些點串起來，但它能最大程度上接近這些點。也就是說5公里的時候，成本為3.5+1.4x5=10.5塊，雖然不完美，但是很接近實際情況。這就是最小二乘法。

機器學習最小二乘

最小二乘加權最小二乘 matlab實現

最小二乘擬合 6 7 最小二乘擬合問題

說說最小二乘

機器學習 最小二乘

最小二乘 加權最小二乘 matlab實現

最小二乘擬合 6 7 最小二乘擬合問題

說說最小二乘

相關推薦

機器學習最小二乘

最小二乘加權最小二乘 matlab實現