百面機器學習 特徵工程總結(完善中 )

2021-10-19 13:15:33 字數 549 閱讀 6195

一、什麼是特徵工程

最大限度從資料中提取特徵供演算法和模型使用。

二、為什麼要特徵工程

資料和特徵決定了機器學習的上界,而模型和演算法只是不斷逼近這個上界。

三、怎樣做特徵工程

資料預處理:

1. 無量綱化

2. 標準化

3. 區間縮放法(歸一化)

4. 定量特徵二值化

5. 定性特徵啞編碼

6. 缺失值計算

7. 資料變換

降維:主成分分析法(pca)

線性判別分析法(lda)

四、有什麼要注意的點

五、參考文獻

特徵工程到底是什麼?:

什麼是特徵工程?如何進行特徵工程?:

特徵工程:

特徵工程的概述:

什麼是特徵工程? // 初識數值型特徵工程技術:

【特徵工程】嘔心之作——深度了解特徵工程:

細說:特徵工程 - feature engineering:

百面-特徵工程:

一文讀懂特徵工程:

七種常用特徵工程:

百面機器學習筆記 特徵工程

特徵工程筆記 為了消除資料特徵之間的量綱影響,我們需要對特徵進行歸一化處理,使得不同指標之間具有可比性。特徵歸一化 normalization 使各指標處於同一數值量級,以便進行分析。1 線性函式歸一化 min max scaling 它對原始資料進行線性變換,使結果對映到 0,1 的範圍,實現對原...

機器學習中特徵工程總結

構造更多 的特徵 檢視資料列名 print data train.columns 檢視資料每列資訊 數目,空置和型別 print data train.info 檢視每列統計資訊 數目 均值 方差 最小值 25 分位值 50 分位值 75 分位值和最大值 print data train.descr...

《百面機器學習》讀書筆記(一) 特徵工程

全部筆記的彙總貼 百面機器學習 讀書筆記彙總 特徵工程,顧名思義,是對原始資料進行一系列工程處理,將其提煉為特 徵,作為輸入供演算法和模型使用。從本質上來講,特徵工程是乙個表示和展現資料的過程。在實際工作中,特徵工程旨在去除原始資料中的雜質和冗餘,設計更高效的特徵以刻畫求解的問題與 模型之間的關係。...