機器學習之隨機森林（一）

如果大家想學人工智慧的話，那麼就一定不能夠忽視有關機器學習的內容。這時候就會有人問，什麼是機器學習？所謂機器學習就是一門多領域交叉學科，涉及概率論、統計學、逼近論等多門學科。機器學習是專門研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的效能的一門技術，而機器學習中隨機森林是乙個十分重要的演算法，在這篇文章中我們就詳細給大家介紹一下隨機森林的相關知識。

一般來說，隨機森林是用於分類和回歸的監督式整合學習模型。為了要使整體效能更好，因此整合學習模型聚合了多個機器學習模型。這是因為每個模型單獨使用時效能表現的不是很好，但如果放在乙個整體中則很強大。在隨機森林模型下，使用大量弱因子的決策樹，來聚合它們的輸出，結果能代表更強的整合。

為了確定偏差和方差，對這兩個輸出進行比較，偏差是機器學習模型中**值與實際值之間的差異，而方差則是這些**值的分布情況。這就是隨機森林的偏差和方差。而簡單來說，偏差是當演算法作了太多簡化假設之後出現的錯誤，這導致模型**值與實際值有所出入。方差是由於演算法對訓練資料集中小變化的敏感性而產生的誤差；方差越大，意味著演算法受資料變化的影響更大。其實對於偏差和方差大家不必擔心，這是因為理想情況下，偏差和方差都會很小，這意味模型在相同資料集的不同資料中的**值很接近真值。當這種情況發生時，模型可以精確地學習資料集中的潛在模式。

機器學習之隨機森林（一）

機器學習之隨機森林（一）

機器學習之隨機森林（一）

機器學習 隨機森林

相關推薦

機器學習隨機森林