機器學習 8 特徵選擇

2022-01-23 15:58:42 字數 876 閱讀 5950

用過濾法對以下資料進行特徵選擇:

[[0,2,0,3],

[0,1,4,3],

[0,1,1,3]]

要求:1、

variance threshold

(threshold =1.0

)實現**如下:

from sklearn.feature_selection import

variancethreshold

import

numpy as np

#刪除低方差的特徵函式

defvar(data, i):

var = variancethreshold(threshold=i)

data =var.fit_transform(data)

print("

當threshold={}時:\n

".format(i), data)

#主函式

if__name__ == "

__main__":

#將列表list轉換為 ndarray 陣列。

data = np.array([[0, 2, 0, 3],

[0, 1, 4, 3],

[0, 1, 1, 3]])

for i in range(2):

i =float(i)

var(data, i)

測試結果:

結論:我們發現在三組資料裡,我們發現第一列,(注意是觀察每一列的資料)全是0,第二列方差小於

1,第四列也是相同的值,那麼這些列的區分度就會很微弱,也就不具備分析的價值了。

機器學習 特徵選擇

特徵選擇是特徵工程中的重要問題 另乙個重要的問題是特徵提取 坊間常說 資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已。由此可見,特徵工程尤其是特徵選擇在機器學習中占有相當重要的地位。通常而言,特徵選擇是指選擇獲得相應模型和演算法最好效能的特徵集,工程上常用的方法有以下 1.計算每...

機器學習 特徵選擇

資料預處理完成以後,特徵比較多時,就需要對特徵進行選擇。使有意義的特徵輸入模型進行訓練。特徵選擇通常來說從兩個方面入手 特徵選擇的方法 在sklearn中可以使用feature selection庫來進行特徵選擇。2.1.1 方差選擇法 方差選擇法需要計算各特徵的方差,然後根據給定的方差閾值選擇特徵...

機器學習 特徵選擇

當資料預處理完成後,我們需要選擇有意義的特徵輸入機器學習的演算法和模型進行訓練。通常來說,從兩個方面考慮來選擇特徵 根據特徵選擇的形式又可以將特徵選擇方法分為3種 embedded 嵌入法,先使用某些機器學習的演算法和模型進行訓練,得到各個特徵的權值係數,根據係數從大到小選擇特徵。類似於filter...