機器學習筆記16 GBDT演算法

前面一節我們提到了adaboost演算法，adaboost演算法可以解決分類問題，通過計算模型每次更新後的誤差率，對資料和模型的權重alpha進行更新。但對於回歸問題，我們就需要使用提公升樹、梯度提公升樹演算法。梯度提公升樹與提公升樹的區別在於，提公升樹採用殘差，而梯度提公升樹採取擬合當前模型損失函式的負梯度(在損失函式為均方誤差的時候，相當於就是殘差，其它誤差函式不一定就是殘差)，來生成乙個新的cart回歸樹。並且在gbdt中，只能使用cart回歸樹，所以在在gbdt中，模型的最終**結果就是所有樹的**結果累加（不管是回歸還是分類問題）

（1）初始化弱分類器

（2）for迴圈，對迭代次數m=1,2,......,m，m為迭代的總次數

（a）對i=1,2,......,n，計算負梯度

（b）對

（c）對每乙個葉子節點區域，計算最佳擬合值c(線性搜尋)

（d）更新回歸樹，得到的c和前面m-1棵樹相加

（3）得到最終的回歸樹

從這裡就可以看出，gbdt本質上通過累加"殘差"(打引號的原因是因為gbdt用負梯度近似了提公升樹的殘差)來達到最後生成強學習器的目的。

此外gbdt還能解決二分類問題、多分類問題。

參考部落格：

機器學習筆記16 GBDT演算法

機器學習（五） GBDT演算法

機器學習 GBDT演算法梳理

機器學習 GBDT

機器學習筆記16 GBDT演算法

機器學習（五） GBDT演算法

機器學習 GBDT演算法梳理

機器學習 GBDT

相關推薦