說一下id3決策樹

決策樹看起來比較容易理解，而且，非常適合描述分類的過程和結果。

決策樹有兩類，分別是id3和cart。

id3適合用於離散型的特徵。

cart適合於連續型。

決策樹可以用最小熵來從n個樣本中的m個特徵中，挑選某個特徵的某個值，來做**。

（1）輸入n個樣本;

（2）從這n個樣本中挑選剩餘的s個特徵，然後通過最小熵理論挑選出最合適用來**的某個特徵，以及用來做**的值。比如，有一組樣本，它們的特徵是「年齡」「性別」「身高」，然後我們通過最小熵理論計算，挑選出了「性別」，並以「男」來做**。如果我們挑選出了「身高」這個特徵用來**，並且以「180cm」來作為**值，也是可以的（雖然我們說更適合離散型的特徵），也就是說，低於180的分一組，高於180的去另外一組這樣，等於的去第三組。也可以等於的一組，其它另外一組。這個比較靈活。

（3）這樣，在新的分組中，再次應用構造樹演算法，並且把原來的s個特徵減少為s-1個特徵（也就是說，上一次挑選出來的特徵不再用了，這是比較簡化的做法）

說一下id3決策樹

決策樹 ID3構建決策樹

決策樹之 ID3

決策樹 ID3演算法

說一下id3決策樹

決策樹 ID3構建決策樹

決策樹之 ID3

決策樹 ID3演算法

相關推薦