資料標準化

2021-07-24 05:23:36 字數 1217 閱讀 2862

資料標準化,是指將資料按比例縮放,使之落到乙個特定的區間,資料標準化目的是為消除單位的影響,方便進行比較分析,常用的資料標準化方法有【0-1標準化】和【z標準化】。

0-1標準化

0-1標準化也稱為離差標準化,它是對原始資料進行線性變換,使結果落到[0,1]區間。0-1標準化還有個好處,就是很方便做十分制、百分之的換算,只需要乘上10或者100即可。

計算公式:

我們還是以「使用者明細」進行介紹,對使用者的年齡進行0-1標準化計算處理,得到乙個「標準化值」變數。

第一步:開啟「使用者明細」檔案,單擊【轉換】-【計算變數】,彈出【計算變數】對話方塊。

第二步:【計算變數】對話方塊中,在【數字表示式】框中輸入公式"(年齡-16)/(78-16)",這樣就完成了公式的編寫。

接著在【目標變數】中填寫標準化值,【型別和標籤】中設定型別「數值」。單擊【繼續】按鈕,返回【計算變數】對話方塊,單擊【確定】按鈕,增加乙個新的變數「標準化值「。

z標準化

z標準化也稱為標準差標準化,它是將變數中的觀察值減去該變來那個的平均值,然後除以該變數的標準差。經過處理的資料符合標準正太分布,即均值為0,標準差為1,也是spss中最常用的標準化方法。

計算公式:

我們還是以」使用者明細「檔案介紹。對使用者年齡進行z標準化計算處理。spss提供了乙個可以直接得到z標準化值得功能

第一步:開啟」使用者明細「資料檔案,單擊【分析】選單,將滑鼠移到【描述統計】。選擇【描述】,彈出【描述】對話方塊。

第二步:在【描述】對話方塊中,將」年齡「變數移至【變數】框中,勾選【將標準化值另存為變數】,單擊【確定】就可以增加乙個名為」z年齡「的變數。

資料標準化

從廣義上來講,資料標準化的過程可以看作是業務系統內部或業務系統之間,乃至整個資料治理系統中的乙個 語言 統一的過程。只有語言統一,才能讓同一業務系統或者不同業務系統之間有了對話 呼叫 通訊的可能,從而保證使用的都是特定的某乙個方言。同樣,資料標準化的過程反映程式及系統設計或架構級別時,就可以看作連線...

資料標準化

特徵縮放 feature scaling 1 也稱為資料的標準化 normalization 是將資料按比例縮放,使之落入乙個特定區間。不同資料往往具有不同的量綱,會影響到資料分析的結果,為了消除資料之間的量綱影響,需要進行資料標準化處理,以解決資料指標之間的可比性。原始資料經過資料標準化處理後,各...

資料標準化

從廣義上來講,資料標準化的過程可以看作是業務系統內部或業務系統之間,乃至整個資料治理系統中的乙個 語言 統一的過程。只有語言統一,才能讓同一業務系統或者不同業務系統之間有了對話 呼叫 通訊的可能,從而保證使用的都是特定的某乙個方言。同樣,資料標準化的過程反映程式及系統設計或架構級別時,就可以看作連線...