吳恩達機器學習筆記多變數線性回歸

目錄前言

一、多維特徵

二、多變數梯度下降

1.代價函式

2.批量梯度下降演算法

3.**演示（未驗證）

三、特徵縮放（幫助梯度下降演算法更快收斂）

1.為什麼要進行特徵縮放

2.特徵縮放的幾種方法

3.進行特徵縮放的注意事項總結

目前為止，我們**了單變數/特徵的回歸模型，現在我們對房價模型增加更多的特徵，例如房間數樓層等，構成乙個含有多個變數的模型，引出多變數線性回歸問題。

支援多變數的假設 ℎ 表示為：

ℎ?(?) = ?0 + ?1?1 + ?2?2+. . . +????

這個公式中有? + 1個引數和?個變數，為了使得公式能夠簡化一些，引入?0 = 1，則公式轉化為：

ℎ?(?) = ?0?0 + ?1?1 + ?2?2+. . . +????

此時模型中的引數是乙個? + 1維的向量，任何乙個訓練例項也都是? + 1維的向量，特徵矩陣?的維度是 ?（樣本數） ∗ (? + 1)。

因此公式可以簡化為：

ℎ?(?) =（t代表轉置矩陣）

在多變數線性回歸中，我們也構建乙個代價函式，則這個代價函式是所有建模誤差的平方和。函式如下：

ℎ?(?) 為：

求導後得：

經過各種簡化後，可以得出乙個通用公式（右下角那個）：

如果某個特徵的取值範圍比其他特徵大很多，那麼數值計算（比如說計算歐式距離）就受該特徵的主要支配。但實際上並不一定是這個特徵最重要，通常需要把每個特徵看成同等重要。歸一化/標準化資料可以使不同維度的特徵放在一起進行比較，可以大大提高模型的準確性。

在我們面對多維特徵問題的時候，我們要保證這些特徵都具有相近的尺度，這將幫助梯度下降演算法更快地收斂。

首先了解一下歸一化和標準化的區別：

1.最大最小值歸一化（min-max normalization）：將數值範圍縮放到 [0, 1] 區間裡

2.均值歸一化（mean normalization）：將數值範圍縮放到 [-1, 1] 區間裡，且資料的均值變為0

3.標準化 / z值歸一化（standardization /z-scorenormalization）：將數值縮放到0附近，且資料的分布變為均值為0，標準差為1的標準正態分佈（先減去均值來對特徵進行中心化 mean centering處理，再除以標準差進行縮放）

4.最大絕對值歸一化（max abs normalization ）：也就是將數值變為單位長度（scaling to unit length），將數值範圍縮放到 [-1, 1] 區間裡

5.穩鍵標準化（robust standardization）：先減去中位數，再除以四分位間距（interquartile range），因為不涉及極值，因此在資料裡有異常值的情況下表現比較穩健

ps：有一些時候，只對資料進行中心化和縮放是不夠的，還需對資料進行白化（whitening）處理來消除特徵間的線性相關性。

需要先把資料拆分成訓練集與驗證集，在訓練集上計算出需要的數值（如均值和標準值），對訓練集資料做標準化/歸一化處理（不要在整個資料集上做標準化/歸一化處理，因為這樣會將驗證集的資訊帶入到訓練集中，這是乙個非常容易犯的錯誤），然後再用之前計算出的資料（如均值和標準值）對驗證集資料做相同的標準化/歸一化處理。

參考：

吳恩達機器學習筆記多變數線性回歸

吳恩達機器學習筆記（2）多變數線性回歸

吳恩達《機器學習》課程總結（4）多變數線性回歸

吳恩達機器學習筆記第五章多變數線性回歸

吳恩達機器學習筆記 多變數線性回歸

吳恩達機器學習筆記（2） 多變數線性回歸

吳恩達《機器學習》課程總結（4）多變數線性回歸

吳恩達機器學習筆記 第五章 多變數線性回歸

相關推薦

吳恩達機器學習筆記多變數線性回歸

吳恩達機器學習筆記（2）多變數線性回歸

吳恩達機器學習筆記第五章多變數線性回歸