WEKA中的資料預處理

資料預處理包括資料的缺失值處理、標準化、規範化和離散化處理。

資料的缺失值處理：weka.filters.unsupervised.attribute.replacemissin**alues。對於數值屬性，用平均值代替缺失值，對於nominal屬性，用它的mode(出現最多的值)來代替缺失值。

標準化(standardize)：類weka.filters.unsupervised.attribute.standardize。標準化給定資料集中所有數值屬性的值到乙個0均值和單位方差的正態分佈。

規範化(nomalize):類weka.filters.unsupervised.attribute.normalize。規範化給定資料集中的所有數值屬性值，類屬性除外。結果值預設在區間[0,1]，但是利用縮放和平移引數，我們能將數值屬性值規範到任何區間。如：但scale=2.0，translation=-1.0時，你能將屬性值規範到區間[-1,+1]。

離散化(discretize):類weka.filters.supervised.attribute.discretize和weka.filters.unsupervised.attribute.discretize。分別進行監督和無監督的數值屬性的離散化，用來離散資料集中的一些數值屬性到分類屬性。

WEKA中的資料預處理

weka之資料預處理

sklearn中的資料預處理

ML中的資料預處理

WEKA中的資料預處理

weka之資料預處理

sklearn中的資料預處理

ML中的資料預處理

相關推薦