AdaBoost 從原理到實現

對於adaboost，可以說是久聞大名，據說在deep learning出來之前，svm和adaboost是效果最好的兩個演算法，而adaboost是提公升樹(boosting tree)，所謂「提公升樹」就是把「弱學習演算法」提公升(boost)為「強學習演算法」(語自《統計學習方法》)，而其中最具代表性的也就是adaboost了，貌似adaboost的結構還和neural network有幾分神似，我倒沒有深究過，不知道是不是有什麼乾貨

這就是adaboost的結構，最後的分類器ym是由數個弱分類器（weak classifier）組合而成的,相當於最後m個弱分類器來投票決定分類，而且每個弱分類器的「話語權」α不一樣。

這裡闡述下演算法的具體過程：

具體說來，整個adaboost 迭代演算法就3步：

初始化訓練資料的權值分布。如果有n個樣本，則每乙個訓練樣本最開始時都被賦予相同的權重：1/n。

訓練弱分類器。具體訓練過程中，如果某個樣本點已經被準確地分類，那麼在構造下乙個訓練集中，它的權重就被降低；相反，如果某個樣本點沒有被準確地分類，那麼它的權重就得到提高。然後，權重更新過的樣本集被用於訓練下乙個分類器，整個訓練過程如此迭代地進行下去。

將各個訓練得到的弱分類器組合成強分類器。各個弱分類器的訓練過程結束後，加大分類誤差率小的弱分類器的權重，使其在最終的分類函式中起著較大的決定作用，而降低分類誤差率大的弱分類器的權重，使其在最終的分類函式中起著較小的決定作用。換言之，誤差率低的弱分類器在最終分類器中佔的權重較大，否則較小。a).訓練弱分類器ym()，使其最小化權重

誤差函式（weighted error function）：

b)接下來計算該弱分類器的話語權α：

c)更新權重：

其中zm：

是規範化因子，使所有w的和為1。(這裡公式稍微有點亂)

AdaBoost 從原理到實現

AdaBoost 從原理到實現

KNN從原理到實現

單點登入（SSO），從原理到實現

AdaBoost 從原理到實現

AdaBoost 從原理到實現

KNN從原理到實現

單點登入（SSO），從原理到實現

相關推薦