Python資料標準化

2022-07-18 18:24:10 字數 1785 閱讀 8915

z-score標準化

1.產生隨機數

import

numpy as np

## 產生隨機數

data_1 = np.random.randn(3, 4) #

從標準正態分佈中返回乙個或多個樣本值.

data_2 = np.random.rand(3, 4) #

產生(0,1)的數

print('

randn產生的隨機數:\n

', data_1)

print('

rand產生的隨機數:\n

', data_2)

shape =data_1.shape

print('

data_1的維數:\n

', shape)

2.使用sklearn包

from sklearn.preprocessing import

standardscaler

## 標準化(使特徵資料方差為1,均值為0)

#使用sklearn的包

scaler =standardscaler()

scaler.fit(data_2)

#使用transfrom必須要用fit語句

trans_data_2 = scaler.transform(data_2) #

transfrom通過找中心和縮放等實現標準化

fit_trans_data_2 = scaler.fit_transform(data_2) #

fit_transfrom為先擬合資料,然後轉化它將其轉化為標準形式

print('

使用fit,transform標準化的資料:\n

', trans_data_2)

print('

使用fit_transform標準化的資料:\n

', fit_trans_data_2)

3.使用numpy進行處理

import

numpy as np

#使用numpy的語句

sum_total = data_2.sum() #

整個矩陣求和

sum_row = data_2.sum(axis=1) #

行求和sum_col = data_2.sum(axis=0) #

列求和mean = np.mean(data_2, axis=0) #

求平均值

std = np.std(data_2, axis=0) #

標準差var = std**2

print('

data_2求和為:\n

', sum_col/3)

print('

平均值為:\n

', mean)

print('

方差為:\n

', var)

numpy_trans_data_2 = (data_2 - mean)/std

print('

使用numpy進行標準化:\n

', numpy_trans_data_2)

注意:z-score標準化是要除以std(標準差),恰好對應於standardscaler()

min-max標準化僅僅將standardscaler()換為minmaxscaler()即可

python 資料標準化

def datastandard from sklearn import preprocessing import numpy as np x np.array 1.1.2.2.0.0.0.1.1.print 原始資料為 n x print method1 指定均值方差資料標準化 預設均值0 方差 ...

Python 資料標準化

定義 將資料按照一定的比例進行縮放,使其落入乙個特定的區間。好處 加快模型的收斂速度,提高模型 精度 常見的六種標準化方法 class datanorm def init self self.arr 1 2,3 4,5 6,7 8,9 self.x max max self.arr self.x m...

python中資料標準化

公式為 x mean std 計算時對每個屬性 每列分別進行。將資料按期屬性 按列進行 減去其均值,並處以其方差。得到的結果是 對於每個屬行 每列來說所有資料都聚集在0附近,方差為1。實現時,有兩種不同的方式 1 sklearn.preprocessing.scale 函式,可以直接將給定資料進行標...