2 4整合演算法

為什麼要整合演算法？

模型的評判標準：min 偏差+方差；

對不同的演算法模型，可以通過調優過程使訓練集資料對該模型做到「最佳」；然而大部分模型自身存在著問題使偏差或者方差天生偏高，如決策樹易過擬合則方差較高；樸素貝葉斯模型簡單，偏差較高；因此需要利用一些策略來彌補天生的缺失。

整合學習：將若干弱分類器組合之後產生乙個強分類器。弱分類器（weak learner）指那些分類準確率只稍好於隨機猜測的分類器（error rate < 50%）。如今整合學習有兩個流派，一種是bagging流派，它的特點是各個弱學習器之間沒有依賴關係，可以並行擬合，隨機森林演算法就屬於bagging派系；另乙個是boosting派系，它的特點是各個弱學習器之間有依賴關係，adaboost演算法就屬於boosting派系。在實現整合學習演算法時，很重要的乙個核心就是如何實現資料的多樣性，從而實現弱分類器的多樣性。整合學習的思想如下圖所示：

2 4整合演算法

整合演算法原理 Adaboost

整合演算法隨機森林

機器學習整合演算法

2 4整合演算法

整合演算法原理 Adaboost

整合演算法 隨機森林

機器學習 整合演算法

相關推薦

整合演算法隨機森林

機器學習整合演算法