決策樹演算法

2021-08-11 20:49:40 字數 492 閱讀 9866

之前上機器學習課程時學過決策樹的一些演算法,今天簡單複習一下:

這裡選擇屬性a作為分類屬性,values(a)為屬性a的所有取值,sv為 取屬性s取值為v時對應的集合,也即對每個取值v,都計算其對應的子集合的資訊熵e(sv),然後用其佔總集合的比例加權,求和即可得到將屬性a作為分類屬性後的資訊熵,用原來的資訊熵減去分類後的資訊熵即為資訊增益。很明顯,資訊增益越大越好。

因此,id3演算法每次選擇剩下的屬性中可以使得資訊增益最大的那個屬性作為分類屬性。

id3演算法:

如下圖所示:

決策樹演算法

決策樹是一種樹型結構,其中每個內部結點表示在乙個屬性上的測試,每個分支代表乙個測試輸出,每個葉結點代表一種類別。決策樹學習是以例項為基礎的歸納學習,採用的是自頂向下的遞迴方法,其基本思想是以資訊熵為度量構造一棵熵值下降最快的樹,到葉子結點處的熵值為零,此時每個葉節點中的例項都屬於同一類。決策樹學習演...

決策樹演算法

本文主要介紹id3 c4.5和cart演算法 決策樹起源於概念學習系統 cls 概念學習模型 是乙個事先定義的範疇集合和一些有關例子是否落入給定範疇的判定 概念學習的主要任務 是判斷所給定事物的屬性或特性,並且正確地區分這些事物,將其劃分到某乙個範疇 對於如下決策樹模型 我們首先考慮他的屬性outl...

決策樹演算法

引 最近老師布置了課堂展示的作業,主題是決策樹,老師還舉了買西瓜的決策例子,感覺貼近生活也很有意思。在這之前沒有了解過這個概念,通過幾個禮拜的學習收穫不少。一 首先,什麼是決策樹?個人而言,決策樹就是將人在做決策時的思維脈絡以樹的形式展示出來的產物,即決策的過程模型。這是一棵去不去打高爾夫球的決策樹...