機器學習之決策樹分類器

2022-09-12 09:33:11 字數 1021 閱讀 4584

決策樹,當下比較流行的有三種分類器,

c4.5,

id3,

cart,

不過大同小異,主要的區別就是選擇的目標函式不同,id3使用的是資訊增益,c4.5使用資訊增益率,cart使用的是gini係數。

,具體的原理就不說了,去翻翻別的博主吧,下面給出本人測試的小demo,幫助各位學者更快入手。

# -*- coding:utf-8 -*-

from sklearn.datasets import load_iris

from sklearn import preprocessing

from sklearn.model_selection import train_test_split

from sklearn.tree import decisiontreeclassifier

iris=load_iris()

x=iris.data #特徵資料

y=iris.target#標籤資料

#資料劃分

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3,random_state=1)

#資料標準化

scaler=preprocessing.standardscaler().fit(x_train)

x1_train=scaler.transform(x_train)

x1_test=scaler.transform(x_test)

#模型訓練

clf=decisiontreeclassifier(criterion='gini')

clf.fit(x1_train,y_train)

print(clf.predict(x1_test))

print(clf.score(x1_test,y_test))

decisiontreeclassifier(criterion='entropy', min_samples_leaf=3)函式為建立乙個決策樹模型,其函式的引數含義如下所示:

機器學習分類器 決策樹

一 決策樹 經常使用決策樹來處理分類問題,決策樹也是最經常使用的資料探勘演算法,不需要了解機器學習的知識,就能搞明白決策樹是如何工作的。knn演算法可以完成很多分類任務,但它最大的缺點就是無法給出資料的內在含義,決策樹的主要優勢在於資料形式非常容易理解 決策樹能夠讀取資料集合,其乙個重要任務是為了資...

機器學習之決策樹

在這裡,我想以更直觀的方式幫助各位理解 掌握並且運用 注意 是運用 決策樹,從而為機器學習作鋪墊。ps 但還是希望大家稍微知道決策樹大概是什麼樣子。1.根結點 root node 沒有入邊,但有零條或多條出邊 2.內部結點 internal node 恰有一條入邊和 兩條或多條出邊 3.葉結點 le...

機器學習之決策樹

決策樹是很常見的機器學習分類演算法,竟然叫決策樹,那麼它的模型其實就像樹一樣。通過對樣本集的學習,挖掘出有用的規則。對於程式設計師來說或許以條件語句來看就更好理解了,決策樹可以看成是多個if then條件語句的集合。這種模型等同於我們寫的條件語句,所以它的 分類速度是很快的。來個例子了解下決策樹分類...