《機器學習實戰》筆記（三） Ch3 決策樹

資訊增益

熵

劃分資料集

遞迴構建決策樹

測試演算法: 使用決策樹執行分類

使用演算法: 決策樹的儲存

例子: 使用決策樹****眼睛型別

目標：通過決策樹**患者需要佩戴的**眼睛型別。

>> fr = open('lensens.txt')

>> lenses = [inst.strip().split('\t') for inst in fr.readlines()]

>> lenseslabels = ['age', 'prescipt', 'astigmatic', 'tearrate']

>> lensestree = trees.create_tree(lenses, lenseslabels)

>> lensestree

>> treeplotter.create_plot(lensestree)

小節這裡主要是採用id3演算法劃分資料集，用遞迴的方法將資料集轉化為決策樹，並可用pickle模組存儲決策樹的結構。id3演算法無法處理直接數值型資料，需要將其化為標量型數值。決策樹最大的缺點在於過擬合問題。在構建樹的時候，其能夠完全匹配實驗資料，但是這並不是我們想要的，為此，可以刪掉一些只增加了很少資訊的節點，將其併入到其他葉子節點中，或者裁剪一些分支。具體決策樹的很多問題也待整理。

**託管見github

[ch03]:

《機器學習實戰》筆記（三） Ch3 決策樹

（3）機器學習實戰筆記決策樹

《機器學習實戰》學習筆記三決策樹

《機器學習實戰》學習筆記三決策樹

《機器學習實戰》筆記（三） Ch3 決策樹

（3）機器學習實戰筆記 決策樹

《機器學習實戰》學習筆記三 決策樹

《機器學習實戰》學習筆記三 決策樹

相關推薦

（3）機器學習實戰筆記決策樹

《機器學習實戰》學習筆記三決策樹

《機器學習實戰》學習筆記三決策樹