綜合實訓週報六

本週主要是在之前已經了解了許多相關模型和演算法的基礎之下，進一步學習不同的模型對比與效能評估。

邏輯回歸。其優點在於訓練速度較快，分類的時候，計算量僅僅只和特徵的數目相關；簡單易理解，模型的可解釋性非常好，從特徵的權重可以看到不同的特徵對最後結果的影響；適合二分類問題，不需要縮放輸入特徵；記憶體資源占用小，只需要儲存各個維度的特徵值。

決策樹模型。其優點在於簡單直觀，生成的決策樹可以視覺化展示；資料不需要預處理，不需要歸一化，不需要處理缺失資料；既可以處理離散值，也可以處理連續值。缺點在於決策樹演算法非常容易過擬合，導致泛化能力不強（可進行適當的剪枝），採用的是貪心演算法，容易得到區域性最優解。

整合模型整合方法（ensemble method）。通過組合多個學習器來完成學習任務，通過整合方法，可以將多個弱學習器組合成乙個強分類器，因此整合學習的泛化能力一般比單一分類器要好。整合方法主要包括bagging和boosting，bagging和boosting都是將已有的分類或回歸演算法通過一定方式組合起來，形成乙個更加強大的分類。兩種方法都是把若干個分類器集成為乙個分類器的方法，只是整合的方式不一樣，最終得到不一樣的效果。常見的基於baggin思想的整合模型有：隨機森林、基於boosting思想的整合模型有：adaboost、gbdt、xgboost、lightgbm等。

本週實踐學習與上週相比進步不大，主要將重心放優化資料集的方向上，但是與之前相比並沒有顯著提高。

本週得到的成績如圖所示。

綜合實訓週報六

綜合實訓週報一

綜合實訓週報七

綜合實訓週報三

綜合實訓週報六

綜合實訓週報一

綜合實訓週報七

綜合實訓週報三

相關推薦