資料進行歸一化原因

為什麼要進行歸一化處理，下面從尋找最優解這個角度給出自己的看法。

例子假定為**房價的例子，自變數為面積，房間數兩個，因變數為房價。

那麼可以得到的公式為：

[公式]

其中[公式]代表房間數，[公式]代表[公式]變數前面的係數。

其中[公式]代表面積，[公式]代表[公式]變數前面的係數。

首先我們祭出兩張圖代表資料是否均一化的最優解尋解過程。

未歸一化：

我們在尋找最優解的過程也就是在使得損失函式值最小的theta1,theta2。

上述兩幅圖**的是損失函式的等高線。

我們很容易看出，當資料沒有歸一化的時候，面積數的範圍可以從01000，房間數的範圍一般為010，可以看出面積數的取值範圍遠大於房間數。

影響這樣造成的影響就是在畫損失函式的時候，

資料沒有歸一化的表示式，可以為：

[公式]

造成影象的等高線為類似橢圓形狀，最優解的尋優過程就是像下圖所示：

[公式]

其中變數的前面係數幾乎一樣，則影象的等高線為類似圓形形狀，最優解的尋優過程像下圖所示：

這也是資料為什麼要歸一化的乙個原因。

在這裡向憶貞表示抱歉，剽竊了你的成果，我這裡主要是想做個記錄以及想要將要的東西分享給大家，一鞠躬，二鞠躬，三鞠躬。

資料歸一化或者標準化，注意歸一化和標準化不同的原因要強調能不歸一化最好不歸一化，之所以進行資料歸一化是因為各維度的量綱不相同。而且需要看情況進行歸一化。有些模型在各維度進行了不均勻的伸縮後，最優解與原來不等價如svm 需要歸一化。有些模型伸縮有與原來等價，如 lr則不用歸一化，但是實際中往...

在機器學習中，經常需要對資料進行歸一化處理。那麼，為什麼需要進行歸一化處理呢，本文從尋找最優解這個角度解析。例子假定為房價的例子，自變數為面積，房間數兩個，因變數為房價。那麼可以得到的公式為其中代表房間數，代表變數前面的係數。其中代表面積，代表變數前面的係數。首先，我們用兩張圖代表資料是否均...

歸一化化定義歸一化就是要把需要處理的資料經過處理後通過某種演算法限制在你需要的一定範圍內。歸一化方法有兩種形式一種是把數變為 0，1 之間的小數一種是把有量綱表示式變為無量綱表示式 class sklearn.preprocessing.minmaxscaler feature range...