Python資料標準化

z-score標準化

1.產生隨機數

import
numpy as np
## 產生隨機數
data_1 = np.random.randn(3, 4) #
從標準正態分佈中返回乙個或多個樣本值.
data_2 = np.random.rand(3, 4) #
產生(0,1)的數
print('
randn產生的隨機數:\n
', data_1)
print('
rand產生的隨機數:\n
', data_2)
shape =data_1.shape
print('
data_1的維數:\n
', shape)

2.使用sklearn包

from sklearn.preprocessing import
standardscaler
## 標準化(使特徵資料方差為1,均值為0)
#使用sklearn的包
scaler =standardscaler()
scaler.fit(data_2) 
#使用transfrom必須要用fit語句
trans_data_2 = scaler.transform(data_2) #
transfrom通過找中心和縮放等實現標準化
fit_trans_data_2 = scaler.fit_transform(data_2) #
fit_transfrom為先擬合資料,然後轉化它將其轉化為標準形式
print('
使用fit,transform標準化的資料:\n
', trans_data_2)
print('
使用fit_transform標準化的資料:\n
', fit_trans_data_2)

3.使用numpy進行處理

import
numpy as np
#使用numpy的語句
sum_total = data_2.sum() #
整個矩陣求和
sum_row = data_2.sum(axis=1) #
行求和sum_col = data_2.sum(axis=0) #
列求和mean = np.mean(data_2, axis=0) #
求平均值
std = np.std(data_2, axis=0) #
標準差var = std**2
print('
data_2求和為:\n
', sum_col/3)
print('
平均值為:\n
', mean)
print('
方差為:\n
', var)
numpy_trans_data_2 = (data_2 - mean)/std
print('
使用numpy進行標準化:\n
', numpy_trans_data_2)

注意:z-score標準化是要除以std(標準差),恰好對應於standardscaler()

min-max標準化僅僅將standardscaler()換為minmaxscaler()即可

python 資料標準化

def datastandard from sklearn import preprocessing import numpy as np x np.array 1.1.2.2.0.0.0.1.1.print 原始資料為 n x print method1 指定均值方差資料標準化預設均值0 方差 ...

Python 資料標準化

定義將資料按照一定的比例進行縮放，使其落入乙個特定的區間。好處加快模型的收斂速度，提高模型精度常見的六種標準化方法 class datanorm def init self self.arr 1 2,3 4,5 6,7 8,9 self.x max max self.arr self.x m...

python中資料標準化

公式為 x mean std 計算時對每個屬性每列分別進行。將資料按期屬性按列進行減去其均值，並處以其方差。得到的結果是對於每個屬行每列來說所有資料都聚集在0附近，方差為1。實現時，有兩種不同的方式 1 sklearn.preprocessing.scale 函式，可以直接將給定資料進行標...

Python資料標準化

python 資料標準化

Python 資料標準化

python中資料標準化

相關推薦