Logistic回歸分析

2021-09-30 19:30:30 字數 1234 閱讀 8342

1、**

import pandas as pd

import numpy as np

#import xlwt

import xlrd

filename = 'e:/data/chapter5/demo/data/bankloan.xls' #檔案路徑

#outputfile= r'e:\data\chapter4\demo\data\output_principal_component.xls'

data = pd.read_excel(filename) #讀取檔案

#print(data)

x = data.iloc[:,:8].as_matrix() #讀取所有行,第0-7列資料,並將資料轉換成矩陣形式

y = data.iloc[:,8].as_matrix() #第8列所有資料,並將資料轉換成矩陣形式

#print(x)

#print(y)

from sklearn.linear_model import logisticregression as lr

from sklearn.linear_model import randomizedlogisticregression as rlr

rlr = rlr() #建立隨機邏輯回歸模型,篩選變數;在建立模型時,使用了預設閾值0.25,可以用rlr(selection_threshold = 0.4)手動設定閾值

rlr.fit(x, y) #訓練模型

rlr.get_support() #獲取特徵篩選結果

print(rlr.get_support())

print(rlr.scores_) #獲取各特徵分數

print(u'通過隨機邏輯回歸模型篩選特徵結束。')

data_1 = data.drop(u'違約', 1)

print(u'有效特徵為:%s' % ','.join(data_1.columns[rlr.get_support()]))

x = data[data_1.columns[rlr.get_support()]].as_matrix() #篩選好特徵

#print(x)

lr = lr()

lr.fit(x,y)

print(u'邏輯回歸模型訓練結束。')

print(u'模型的平均正確率為: %s' % lr.score(x, y)) #輸出模型的平均正確率

logistic回歸 logistic回歸

logistic回歸 logistic回歸分析可用於估計某個事件發生的可能性,這是乙個分類模型而不是乙個回歸模型!它的基本思想是利用一條直線將平面上的點分為兩個部分,即兩個類別,要解決的問題就是如何擬合出這條直線,這個擬合的過程就稱之為 回歸 logistic模型 假設你有乙個需要 的內容,要通過三...

logistic分類(logistic回歸 LR)

幾乎所有的教材都是從logistic分類開始的,因為logistic分類實在太經典,而且是神經網路的基本組成部分,每個神經元 cell 都可以看做是進行了一次logistic分類。所謂logistic分類,顧名思義,邏輯分類,是一種二分類法,能將資料分成0和1兩類。logistic分類的流程比較簡單...

Logistic回歸模型

一 logistic回歸模型 線性回歸模型要求因變數是連續型正態變數。當因變數是分類變數時,logistic回歸模型是最好的回歸模型。由於y只能取兩個值1或0,y的條件數學期望 e y xi 1 p y 1 xi 0 p y 0 xi p y 1 xi 選擇乙個函式,p y 1 x f x logi...