決策樹演算法

2022-07-25 19:54:09 字數 1243 閱讀 4677

決策樹:

判定樹是乙個類似於流程圖的樹結構:其中,每個內部結點表示在乙個屬性上的測試,每個分支代表乙個屬性輸出,而每個樹葉結點代表類或類分布。樹的最頂層是根節點。

乙個根據天氣情況判斷是否適宜戶外運動的決策樹示例:

熵(entropy)概念:

資訊和抽象,如何度量?

2023年,夏農提出了 」資訊熵(entropy)「的概念。

一條資訊的資訊量大小和它的不確定性有直接的關係,要搞清楚一件非常非常不確定的事情,或者 是我們一無所知的事情,需要了解大量資訊==>資訊量的度量就等於不確定性的多少。

位元(bit)來衡量資訊的多少。

變數的不確定性越大,熵也就越大

決策樹歸納演算法:

選擇屬性判斷結點。

通過a來作為節點分類獲取了多少資訊。

具體步驟與示例:

下表是一組資訊:(包含age、income、是否student、credit_rating信用評級、class:buys_computer是否買電腦)

所以資訊熵的取值在0~1之間。

類似,gain(income) = 0.029, gain(student) = 0.151, gain(credit_rating)=0.048

其餘結點分類類似上述方法。

樹剪枝葉(避免過擬合overfitting):

前置裁剪在構建決策樹的過程時,提前停止。

後置裁剪決策樹構建好後,然後才開始裁剪。

決策樹的優點:

直觀,便於理解,小規模資料集有效

決策樹缺點:

處理連續變數不好

類別較多時,錯誤增加的比較快

可規模性一般

決策樹演算法

決策樹是一種樹型結構,其中每個內部結點表示在乙個屬性上的測試,每個分支代表乙個測試輸出,每個葉結點代表一種類別。決策樹學習是以例項為基礎的歸納學習,採用的是自頂向下的遞迴方法,其基本思想是以資訊熵為度量構造一棵熵值下降最快的樹,到葉子結點處的熵值為零,此時每個葉節點中的例項都屬於同一類。決策樹學習演...

決策樹演算法

本文主要介紹id3 c4.5和cart演算法 決策樹起源於概念學習系統 cls 概念學習模型 是乙個事先定義的範疇集合和一些有關例子是否落入給定範疇的判定 概念學習的主要任務 是判斷所給定事物的屬性或特性,並且正確地區分這些事物,將其劃分到某乙個範疇 對於如下決策樹模型 我們首先考慮他的屬性outl...

決策樹演算法

引 最近老師布置了課堂展示的作業,主題是決策樹,老師還舉了買西瓜的決策例子,感覺貼近生活也很有意思。在這之前沒有了解過這個概念,通過幾個禮拜的學習收穫不少。一 首先,什麼是決策樹?個人而言,決策樹就是將人在做決策時的思維脈絡以樹的形式展示出來的產物,即決策的過程模型。這是一棵去不去打高爾夫球的決策樹...