儲存決策樹模型

2021-10-07 14:12:31 字數 1528 閱讀 3843

"""

步驟:1)安裝graphviz,並設定環境變數:將graphviz的bin目錄加到path

2)安裝pydotplus ,開啟anaconda prompt, 輸入命令 :conda install -c conda-forge pydotplus

3)在anaconda prompt中, 輸入命令 :pip install graphviz ,安裝graphviz外掛程式

"""from sklearn.datasets import load_iris

from sklearn import tree

import pydotplus

import os

# 匯入路徑

# os.environ["path"] += os.pathsep + 'c:/program files (x86)/graphviz2.38/bin/'

# os.environ["path"] += os.pathsep + 'c:/users/dominic jiang/graphviz-2.38/release/bin'

# 匯入資料

iris = load_iris(

)# 構建模型

clf = tree.decisiontreeclassifier(

)clf = clf.fit(iris.data, iris.target)

# 儲存模型

with

open

("iris.dot"

,'w'

)as f:

f = tree.export_graphviz(clf, out_file=f)

# 畫圖,儲存到pdf檔案

# 設定影象引數

dot_data = tree.export_graphviz(clf, out_file=

none

, feature_names=iris.feature_names,

class_names=iris.target_names,

filled=

true

, rounded=

true

, special_characters=

true

)graph = pydotplus.graph_from_dot_data(dot_data)

# 儲存影象到pdf檔案

graph.write_pdf(

"iris_color.pdf"

)# 1.利用graph寫入檔案

a =open

("iris.png"

, mode=

"wb"

)# 2.利用i/o寫檔案

a.write(graph.create_png())

os.system(

"dot -tpdf iris.dot -o iris_w.pdf"

)# 3.利用dot系統命令寫檔案

決策樹模型

決策樹採用樹結構來進行決策的,可以認為是if then規則集合,也可以認為是對特徵空間劃分,每個子空間對應乙個輸出。其優點簡單,快速,可解釋性強。決策樹通常包含三部分 特徵選擇,決策樹生成,決策樹剪枝。資訊增益,資訊增益比,基尼指數是常用的特徵選擇準則 資訊熵 表示變數的不確定程度,資訊熵越大不確定...

決策樹模型

前言 決策樹生成模型三要素 一般而言,一顆 完全生長 的決策樹包含 特徵選擇 決策樹構建 剪枝三個過程。決策樹是一種啟發式貪心演算法,每次選取的分割資料的特徵是當前的最佳選擇,並不關心是否達到最優。一 特徵選擇 1.1 熵 樣本集合 純度 不確定性 穩定性的指標 熵越大,樣本的不確定性就越大 在決策...

決策樹模型

決策樹可以簡單的理解為根據特徵的取值而最終分成不同的類,也可以理解為簡單的if then的規則集合 樹嘛 那麼怎麼樣選擇節點是乙個很有技術的問題。為什麼呢,因為如果你的中間節點擊的不錯是不是就能夠很容易的將決策樹的各個節點很容易的分清楚了 說白了,你選的樹分叉的地方越有區分度 分類越多越好你乙個特徵...