weka之資料預處理

weka在做資料預處理的時候針對attribute提供了多種方式，包括值的各種轉換，常用的如下：

1.缺失值處理

weka.filters.unsupervised.attribute.replacemissingvalues。對於數值屬性，用平均值代替缺失值，對於nominal屬性，用它的mode(出現最多的值)來代替缺失值。

2.規範化處理

類weka.filters.unsupervised.attribute.normalize。規範化給定資料集中的所有數值屬性值，類屬性除外。結果值預設在區間[0,1]，但是利用縮放和平移引數，我們能將數值屬性值規範到任何區間。如：但scale=2.0，translation=-1.0時，你能將屬性值規範到區間[-1,+1]。

3.標準化處理

類weka.filters.unsupervised.attribute.standardize。標準化給定資料集中所有數值屬性的值到乙個0均值和單位方差的正態分佈。

4.離散化處理

類weka.filters.supervised.attribute.discretize和weka.filters.unsupervised.attribute.discretize。分別進行監督和無監督的數值屬性的離散化，用來離散資料集中的一些數值屬性到分類屬性。

**如下：

replacemissingvalues filter = new replacemissingvalues();
filter.setinputformat(instances);
instances newtrain = filter.usefilter(instances, filter);

weka之資料預處理

WEKA中的資料預處理

資料探勘之資料預處理

資料預處理之資料規約

weka之資料預處理

WEKA中的資料預處理

資料探勘之資料預處理

資料預處理之資料規約

相關推薦