分類學習 整合學習

2021-08-14 22:11:41 字數 2026 閱讀 5690

#鐵達尼號沉船事故

#鐵達尼號乘客資料查驗

import pandas as pd #匯入pandas用於資料分析

titanic = pd.read_csv('')

titanic.head() #觀察前幾行資料

titanic.info() #檢視資料的統計特徵

#特徵選取,機器學習很重要的乙個環節

x = titanic[['pclass', 'age', '***']] #這三個特徵可能決定是否能夠倖免

y = titanic['survived']

x['age'].fillna(x['age'].mean, inplace = true) #將age特徵缺失行用平均值補充

#資料分割

from sklearn.cross_validation import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, train_size = 0.25, random_state = 33)

#特徵轉換器轉換特徵

from sklearn.feature_extraction import dictvectorizer

vec = dictvectorizer(sparse=false)

x_train = vec.fit_transform(x_train.to_dict(orient='record')) #將類別型的特徵都單獨剝離出來

x_test = vec.transform(x_test.to_dict(orient='record'))

#決策樹分類器

from sklearn.tree import decisiontreeclassifier

dtc = decisiontreeclassifier() #初始化分類器

dtc.fit(x_train, y_train) #訓練分類器

y_predict = dtc.predict(x_test) #用訓練好的模型進行**

#使用隨機森林進行整合模型訓練

from sklearn.ensemble import randomforestclassifier

rfc = randomforestclassifier()

rfc.fit(x_train, y_train)

y_rfc_predict = rfc.predict(x_test)

#使用梯度提公升決策樹進行整合模型的訓練

from sklearn.ensemble import gradientboostingclassifier

gbc = gradientboostingclassifier()

gbc.fit(x_train, y_train)

y_gbc_predict = gbc.predict(x_test)

#單一決策樹效能分析,輸出分類任務的評價指標,精確度、召回率、f1指標

from sklearn.metrics import classification_report

print('accuracy of decisiontree is :',dtc.score(x_test, y_test))

print(classification_report(y_predict, y_test))

print('accuracy of randomforest is :',rfc.score(x_test, y_test))

print(classification_report(y_rfc_predict, y_test))

print('accuracy of gradientboosting is :',gbc.score(x_test, y_test))

print(classification_report(y_gbc_predict, y_test))

多分類學習

多分類學習的基本思路是拆解法,即將多個二分類任務拆為若干個二分類任務求解。具體地就是,先對問題進行拆分,然後為每個拆分的二分類任務訓練乙個分類器 在測試時,對這些分類器的 結果進行整合以獲得最終的多分類結果。關鍵 多分類任務如何拆分。經典的為 一對一 one vs one,ovo 一對多 one v...

IP分類學習

0.0.0.0 代表的是所有網段也是作為保留網段的。a類 10.0.0.0 to 10.255.255.255 b類 172.16.0.0 to 172.31.255.255 c類 192.168.0.0 to 192.168.255.255 總結如下 a類位址255.0.0.0 8 1 a類位址第...

theano學習之分類學習

from future import print function import numpy as np import theano import theano.tensor as t 該函式功能用來計算準確率 def compute accuracy y target,y predict corr...