機器學習整合演算法

整合演算法用一些相對較弱的學習模型獨立地就同樣的樣本進行訓練，然後把結果整合起來進行整體**。整合演算法的主要難點在於究竟整合哪些獨立的較弱的學習模型以及如何把學習結果整合起來。這是一類非常強大的演算法，同時也非常流行。

是構建多個學習器，然後通過一定策略結合把它們來完成學習任務的，常常可以獲得比單一學習顯著優越的學習器。周志華的書上說，「個體學習器的"準確性"和"多樣性"本身就存在衝突，一般準確性很高之後，要增加多樣性就需犧牲準確性。事實上，如何產生並結合『好而不同』的個體學習器，恰是整合學習研究的核心」（對準確性和多樣性的論述還不是很理解）。

按照個體學習器之間的關係，分為bagging、boosting、stacking三大類。

bagging的原理首先是基於自助取樣法（bootstrap sampling）隨機得到一些樣本集訓練，用來分別訓練不同的基學習器，然後對不同的基學習器得到的結果投票得出最終的分類結果。自助取樣法得到的樣本大概會有63%的資料樣本被使用，剩下的可以用來做驗證集。

隨機森林其實也算bagging的一種，但是有一點區別是隨機森林在構建決策樹的時候，會隨機選擇樣本特徵中的一部分來進行劃分。由於隨機森林的二重隨機性，它具有良好的學習效能。

機器學習整合演算法

機器學習python整合演算法

機器學習之整合演算法

機器學習整合演算法 GBDT

機器學習 整合演算法

機器學習python整合演算法

機器學習之整合演算法

機器學習 整合演算法 GBDT

相關推薦

機器學習整合演算法

機器學習整合演算法 GBDT