偏最小二乘回歸分析線性回歸特徵歸一化

今天碰見一句**

features = torch.tensor(np.random.normal(0, 1, (1000, 2)));

其中 features是訓練資料特徵 np為numpy （import numpy as np）

關於np.random.normal(0, 1, (1000, 2))

noise = np.random.normal(0, 0.05, x_data.shape)

於是有乙個問題為什麼資料特徵需要服從均值為0 方差為1 的高斯分布？

原因一：為了讓估計出的回歸係數是無偏估計。

【有關無偏性，一致性，有效性

總體來說

無偏性就是期望等於本身

】

總體引數的估計值必須符合一些好的特性才行，比如無偏性，相合性（一致性），有效性之類的，否則你的估計值就是瞎猜。如果假定誤差均值為零，則最小二乘估計出來的回歸係數就是無偏的。

乙個估計量並不是說無偏就一定好，也可以有偏。如果有偏，只要它和無偏估計量相比較「均方誤差」更小，則我們就可以選用有偏的估計量。比如嶺回歸得到的回歸係數就是有偏估計量，但是它比最小二乘得到的回歸係數均方誤差更小。

如果假定誤差期望為零，再加上其它幾個假定就能保證回歸係數是「最佳線性無偏估計量」，也就意味著最小二乘方法不是瞎猜，是科學的，並且在眾多科學的方法中它都是比較好的。

上面是原因一，一般的教科書都會提到。再說另外乙個更重要的原因，這個原因幾乎沒什麼書會提到。

原因二：

為了讓總體回歸方程可以被估計。

偏最小二乘回歸分析 線性回歸特徵歸一化