邏輯回歸模型建立

2021-10-07 21:07:44 字數 2692 閱讀 7533

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

%matplotlib inline

#載入資料

churn=pd.read_csv(『w4_churn.csv』)

將資料集中的類別變數轉化為數字型變數

churn=pd.get_dummies(churn)

####檢視前5行資料

churn.head()

#資料整理,將churn_yes保留,將female保留,drop不需要的資料

churn.drop([『churn_no』,『gender_male』],axis=1,inplace=true)

#檢視資料

churn.head()

#統一大小寫

churn.columns=churn.columns.str.lower()

#修改欄位名

churn=churn.rename(columns=)

#檢視資料

churn.head()

#基於模型的結果,對訓練集與測試集中x的真實值**對應的y

y_pred_train=lr.predict(x_train)

y_pred_test=lr.predict(x_test)

print(y_pred_train)

#搭建訓練集混淆矩陣

import sklearn.metrics as metrics

metrics.confusion_matrix(y_train,y_pred_train)

#計算訓練集準確率

metrics.accuracy_score(y_train,y_pred_train)

#搭建測試集混淆矩陣

metrics.confusion_matrix(y_test,y_pred_test)

#計算測試集準確率

metrics.accuracy_score(y_test,y_pred_test)

#載入資料切分工具包

from sklearn.model_selection import train_test_split

#切分訓練集和測試集

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.5,random_state=100)

#建模from sklearn import linear_model

lr=linear_model.logisticregression()

lr.fit(x_train,y_train)

#基於模型的結果,對訓練集與測試集中x的真實值**對應的y

y_pred_train=lr.predict(x_train)

y_pred_test=lr.predict(x_test)

print(y_pred_train)

#優化模型評估 計算準確率

#搭建測試集混淆矩陣

metrics.confusion_matrix(y_test,y_pred_test)

#計算測試集準確率

metrics.accuracy_score(y_test,y_pred_test)

#搭建訓練集混淆矩陣

import sklearn.metrics as metrics

metrics.confusion_matrix(y_train,y_pred_train)

#計算訓練集準確率

metrics.accuracy_score(y_train,y_pred_train)

y=churn[『flag』]

x=churn[[『contract_month』,『internet_other』,『paymentelectronic』]]

#載入資料切分工具包

from sklearn.model_selection import train_test_split

#切分訓練集和測試集

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.5,random_state=100)

#建模from sklearn import linear_model

lr=linear_model.logisticregression()

lr.fit(x_train,y_train)

#基於模型的結果,對訓練集與測試集中x的真實值**對應的y

y_pred_train=lr.predict(x_train)

y_pred_test=lr.predict(x_test)

print(y_pred_train)

#優化模型評估 計算準確率

#搭建測試集混淆矩陣

metrics.confusion_matrix(y_test,y_pred_test)

#計算測試集準確率

metrics.accuracy_score(y_test,y_pred_test)

#搭建訓練集混淆矩陣

import sklearn.metrics as metrics

metrics.confusion_matrix(y_train,y_pred_train)

#計算訓練集準確率

metrics.accuracy_score(y_train,y_pred_train)

邏輯回歸模型 SAS邏輯回歸模型訓練

邏輯回歸模型是金融信貸行業製作各類評分卡模型的核心,幾乎80 的機器學習 統計學習模型演算法都是邏輯回歸模型,按照邏輯美國金融公司總結的sas建模過程,大致總結如下 一般通用模型訓練過程 a 按照指定需求和模型要求製作driver資料集,包含欄位有user id,dep b 其中,空值賦預設值即 c...

線性模型 邏輯回歸

模型原型 class sklearn.linear model.logisticregression penalty l2 dual false,tol 0.0001,c 1.0,fit intercept true,intercept scaling 1,class weight none,ran...

邏輯回歸 LR模型

邏輯回歸演算法相信很多人都很熟悉,也算是我比較熟悉的演算法之一了,畢業 當時的專案就是用的這個演算法。這個演算法可能不想隨機森林 svm 神經網路 gbdt等分類演算法那麼複雜那麼高深的樣子,可是絕對不能小看這個演算法,因為它有幾個優點是那幾個演算法無法達到的,一是邏輯回歸的演算法已經比較成熟,較為...