機器學習中決策樹介紹

決策樹是一類常見的機器學習方法。決策樹是基於樹結構來進行決策的，決策過程的最終結論對應了所希望的判定結果。決策過程中提出的每個判定問題都是對某個屬性的「測試」，每個測試的結果或是匯出最終結論，或是匯出進一步的判定問題，其考慮範圍是在上次決策結果的限定範圍之內。

一般的，乙個決策樹包含乙個根節點，若干個內部結點和若干個葉結點；葉結點對應於決策結果，其他每個結點則對應於乙個屬性測試；每個結點包含的樣本集合根據屬性測試的結果被劃分到子結點中；根結點包含樣本全集。從根結點到每個葉結點的路徑對應了乙個判定測試序列。決策樹學習的目的是為了產生一棵泛化能力強，即處理未見示例能力強的決策樹。

決策樹的生成是乙個遞迴過程。在決策樹基本演算法中，有三種情形會導致遞迴返回：（1）當前結點包含的樣本全屬於同一類別，無需劃分；（2）當前屬性集為空，或是所有樣本在所有屬性上取值相同，無需劃分（3）當前結點包含的樣本集合為空，不能劃分。

其中，劃分的指標有：1.資訊增益 2.增益率 3.基尼指數（cart是一種著名的決策樹學習演算法，分類和回歸都可用），資料集的純度可用基尼值來度量。

剪枝處理：剪枝是決策樹學習演算法對付「過擬合」的主要手段。決策樹剪枝的基本策略有「預剪枝」和「後剪枝」。預剪枝是在生成決策樹的過程中，對每個結點在劃分前先進行估計，若當前結點的劃分不能帶來決策樹泛化效能提公升，則停止劃分並將當前結點標記為葉結點；後剪枝則是先從訓練集生成一棵完整的決策樹，然後自底向上地對非葉結點進行考察，若將該結點對應的子樹替換為葉結點能帶來決策樹泛化效能提公升，則將該子樹替換為葉結點。

機器學習中決策樹介紹

機器學習決策樹

機器學習決策樹

機器學習決策樹

機器學習中決策樹介紹

機器學習 決策樹

機器學習 決策樹

機器學習 決策樹

相關推薦

機器學習決策樹

機器學習決策樹

機器學習決策樹