Datawhale 零基礎入門金融風控（五）

stacking

將若干基學習器獲得的**結果，將**結果作為新的訓練集來訓練乙個學習器。如下圖假設有五個基學習器，將資料帶入五基學習器中得到**結果，再帶入模型六中進行訓練**。但是由於直接由五個基學習器獲得結果直接帶入模型六中，容易導致過擬合。所以在使用五個及模型進行**的時候，可以考慮使用k折驗證，防止過擬合。

與stacking不同，blending是將**的值作為新的特徵和原特徵合併，構成新的特徵值，用於**。為了防止過擬合，將資料分為兩部分d1、d2，使用d1的資料作為訓練集，d2資料作為測試集。**得到的資料作為新特徵使用d2的資料作為訓練集結合新特徵，**測試集結果。

3. blending與stacking的不同

a. stacking

stacking中由於兩層使用的資料不同，所以可以避免資訊洩露的問題。在組隊競賽的過程中，不需要給隊友分享自己的隨機種子。

b. blending

blending比stacking簡單，不需要構建多層模型。由於blending對將資料劃分為兩個部分，在最後**時有部分資料資訊將被忽略。同時在使用第二層資料時可能會因為第二層資料較少產生過擬合現象。

參考：datawhale–零基礎入門金融風控

Datawhale 零基礎入門金融風控（五）

Datawhale 零基礎入門CV

Datawhale 零基礎入門CV賽事

Datawhale 零基礎入門CV賽事

Datawhale 零基礎入門金融風控（五）

Datawhale 零基礎入門CV

Datawhale 零基礎入門CV賽事

Datawhale 零基礎入門CV賽事

相關推薦