機器學習 第二週 (決策樹)

2021-10-03 17:17:54 字數 1131 閱讀 5355

1.屬性選擇的先後順序

1.id3演算法實現

id3演算法的詳細實現步驟如下:

import pandas as pd

from sklearn.tree import decisiontreeclassifier,export_graphviz

from sklearn.metrics import classification_report

import graphviz

data = pd.read_csv('titanic_data.csv')

data.drop('passengeid',axis=1,inplace=true) #刪除passengeid這一列

data.loc[data['***'] == 'male','***'] =1 #用數值1來代替male,用0來代替female

data.loc[data['***'] == 'female','***'] =0

data.fillna(data['age'].mean(),inplace=true) #用均值來填充缺失值

dtc = decisiontreeclassifier(max_depth=5,random_state=8) #構建決策樹模型

dtc.fit(data.iloc[:,1:],data['survived']) #模型訓練

pre = dtc.predict(data.iloc[:,1:]) #模型**

pre == data['survived'] #比較模型**值與樣本實際值是否一致

classification_report(data['survived'],pre) #模型分類報告

dot_data = export_graphviz(dtc,feature_names=['pclass','***','age'],class_names='survived')

graph = graphviz.source(dot_data)

graph

選擇題

操作題

機器學習(二) 決策樹

決策樹是用於分類的一種機器學習演算法。其最大的特點就是簡單,直觀.由於資料來自於之前的筆記。原例子的出處找不到,乾脆就手繪算了 xd。其中如果資料不是離散值,要先處理成離散值再進行決策樹的計算。圖1 用乙個例子來講吧。如上圖,現在是有14條資料都從調研中得到,其中是研究是否買電腦的資料,rid是列號...

機器學習二 決策樹學習

決策樹學習 從今天開始,堅持每天學習乙個機器學習的新知識,加油!決策樹學習是應用最廣的歸納推理演算法之一,是一種逼近離散值目標函式的方法,在這種方法中學習到的函式被表示為一顆決策樹。決策樹通過把例項從根結點排列到某個葉子結點來分類例項,葉子結點即為例項所屬的分類。樹上的每乙個結點指定了對例項的某個屬...

機器學習筆記二 決策樹

一顆決策樹包含乙個根結點,若干內部結點 對應乙個測試屬性 和若干葉結點 對應決策結果 決策流程採用分而治之的整體思想,根結點包含樣本全集,對各個特徵進行判斷,直至所有葉結點均對應一種類別的樣本。決策樹的關鍵在於劃分屬性的選擇,隨著劃分不斷進行,分支結點所包含樣本應盡可能屬於同一類別,即純度越來越高,...