資料探勘實戰（六）模型融合

如圖，上半部分是用乙個基礎模型進行5折交叉驗證。拿出四折作為training data，另外一折作為testing data。每一次的交叉驗證包含兩個過程，1. 基於training data訓練模型；2. 基於training data訓練生成的模型對testing data進行**。在整個第一次的交叉驗證完成之後我們將會得到5組關於當前testing data的**值，記作a1,a2,a3,a4,a5，即圖的下半部分5個綠色框，將他們拼湊起來，會形成乙個矩陣，記為a1。在這部分操作完成後，我們還要對資料集原來的整個testing set進行**，這部分**值將會作為下一層模型testing data的一部分，記為b1,b2,b3,b4,b5，即右下方的綠色框，我們將它們相加取平均值，得到乙個列向量，記為b1。

以上就是stacking中乙個模型的完整流程，stacking中同一層通常包含多個模型，假設還有model2: lr，model3：rf，model4: gbdt，model5：svm，對於這四個模型，我們可以重複以上的步驟，在整個流程結束之後，我們可以得到新的a2,a3,a4,a5,b2,b3,b4,b5矩陣。我們把a1,a2,a3,a4,a5並列合併得到乙個矩陣作為training data，b1,b2,b3,b4,b5並列合併得到乙個矩陣作為testing data。讓下一層的模型，基於他們進一步訓練。

資料探勘實戰（六）模型融合

資料探勘模型融合

資料探勘模型融合

任務六模型融合

資料探勘實戰（六） 模型融合

資料探勘 模型融合

資料探勘 模型融合

任務六 模型融合

相關推薦

資料探勘實戰（六）模型融合

資料探勘模型融合

資料探勘模型融合

任務六模型融合