銀行借貸決策樹模型

比較簡單的乙個決策樹，根據客戶已有的資訊判斷是否可以發放貸款，記錄一下

#-*- coding:utf-8 -*-
import pandas as pd
import numpy as np
pd.set_option('display.max_columns', 200)
pd.set_option('display.max_rows', 500)
data = pd.read_csv('/users/shaling/downloads/loan_data.txt',
encoding='utf-8', sep='\s+').set_index('nameid')
print(data.head(), data.shape)
from sklearn.tree import decisiontreeclassifier
from sklearn.model_selection import gridsearchcv, train_test_split, cross_val_score
from sklearn import metrics
# 劃分訓練集和測試集
train_x = x[:700]
train_y = y[:700]
text_x = x[700:]
text_y = y[700:]
# 創造模型
dtf = decisiontreeclassifier()
x1, x2, y1, y2 = train_test_split(
train_x, train_y, train_size=0.7, random_state=1)
dtf.fit(x1, y1)
print('模型訓練分數：', dtf.score(x1, y1))
print('模型驗證分數：', dtf.score(x2, y2)) # 過擬合
print('模型測試集分數：', dtf.score(text_x, text_y))
# 模型調參
param = 
dtf = gridsearchcv(decisiontreeclassifier(), param_grid=param, cv=10)
dtf.fit(x1, y1)
print(dtf.best_params_, dtf.best_score_)
dtf = decisiontreeclassifier(
max_depth=6, min_impurity_split=0.1, min_samples_leaf=3)
dtf.fit(x1, y1)
print(dtf.score(x1, y1))
print(dtf.score(x2, y2))
# print(dtf.score(train_x, train_y))
print(dtf.score(text_x, text_y))
pred_y = dtf.predict(text_x)
print(metrics.precision_score(text_y, pred_y))
from sklearn import tree
from ipython.display import image
import pydotplus
dot_data = tree.export_graphviz(dtf, out_file=none,
feature_names=data.columns[:-1],
class_names=data.columns[-1],
filled=true, rounded=true,
special_characters=true)
graph = pydotplus.graph_from_dot_data(dot_data)
graph.write_pdf("銀行借貸模型.pdf")

結果為

模型訓練分數： 0.820040899795501 模型驗證分數： 0.7630331753554502 模型測試集分數： 0.9266666666666666

在視覺化決策樹時，結果總是出現graphviz』s executables not found的錯誤型別，搜尋是因為缺少graphviz，於是pip install graphviz安裝，安裝完之後還是出現錯誤，又上網搜了一通，網上大部分提示還要新增環境變數的都是win系統，少有mac的，有些又建議使用brew install graphviz來安裝依賴包然後拷貝依賴包到執行目錄，裝完發現還是不行，無奈google之發現乙個很相似的情況，使用的的是anaconda來解決的：

conda install graphviz

裝完之後立馬好了。

銀行借貸決策樹模型

決策樹模型

決策樹模型

決策樹模型

相關推薦