r語言歸一化 R語言 資料規範化 歸一化

2021-10-17 06:06:56 字數 833 閱讀 5892

筆者寄語:規範化主要是因為資料受著單位的影響較大,需要進行量綱化。大致有:最小-最大規範化、均值標準化、小數定標規範化

1、最小-最大規範化

也叫離差標準化,是對原始資料的線性變換,將資料對映到[0,1]之間,與功效係數法相同。

#最小-最大規範化

b1=(data[,1]-min(data[,1]))/(max(data[,1])-min(data[,1]))

b2=(data[,2]-min(data[,2]))/(max(data[,2])-min(data[,2]))

b3=(data[,3]-min(data[,3]))/(max(data[,3])-min(data[,3]))

b4=(data[,4]-min(data[,4]))/(max(data[,4])-min(data[,4]))

data_scatter=cbind(b1,b2,b3,b4)

2、均值標準化法

標準差標準化、零均值規範化等方法,經過處理的資料均值為0,標準差為1。公式為:

x*=(x-均值)/標準差

因為均值受離群值影響較大,也可以將均值替換成變數的中位數。

#零-均值規範化

data_zscore=scale(data)

3、小數定標規範化

移動變數的小數點位置來將變數對映到[-1,1]

#小數定標規範化

i1=ceiling(log(max(abs(data[,1])),10))#小數定標的指數

c1=data[,1]/10^i1

i2=ceiling(log(max(abs(data[,2])),10))

c2=data[,2]/10^i2

r語言歸一化 資料變換 歸一化與標準化

一般在機器學習的模型訓練之前,有乙個比較重要的步驟是資料變換。因為,一般情況下,原始資料的各個特徵的值並不在乙個統一的範圍內,這樣資料之間就沒有可比性。資料變換的目的是將不同渠道,不同量級的資料轉化到統一的範圍之內,方便後續的分析處理。資料變換的方法有很多,比如資料平滑,資料聚集,資料概化,資料規範...

資料規範化(歸一化) 及Z score標準化

資料規範化 歸一化 處理是資料探勘的一項基礎工作。不同評價指標往往具有不同的量綱,數值見的差別可能很大,不進行處理可能會影響到資料分析的結果。為了消除指標之間的量綱和取值範圍差異的影響,需要進行標準化處理,將資料按照比例進行縮放,使之落入乙個特定的區域,便於進行綜合分析。如將工資收入屬性值對映到 1...

資料的規範化,歸一化,標準化,正則化

資料的規範化,歸一化,標準化,正則化 打濕井蓋 資料的規範化,歸一化,標準化,正則化,這幾個破詞整得我頭暈,首先這些詞就沒規範好,對資料做實驗更暈,網上狂搜一陣後,發現資料 歸一化,標準化,正則化,還是有差別 資料規範化 一種是針對資料庫的解釋 規範化理論把關係應滿足的規範要求分為幾級,滿足最低要求...