22 高階 流行庫模型 XGBoost

2021-08-18 07:14:36 字數 1506 閱讀 6382

#-*- coding:utf-8 -*-

#對比隨機決策森林和xgboost模型對鐵達尼號的乘客是否生還的**能力

import pandas as pd

titanic = pd.read_csv('')

#根據分析,我們認為***,age,pclass這些特徵都很有可能成為決定倖免與否的決定性因素

x = titanic[['pclass','***','age']]

y = titanic['survived']

#填充age的缺失值,用平均值來代替

x['age'].fillna(x['age'].mean(),inplace=true)

#對原始資料進行分割

from sklearn.cross_validation import train_test_split

x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.25,random_state=33)

#這裡匯入的是dictvectorizer,作用是將符號化特徵,轉成數字型0/1表示

from sklearn.feature_extraction import dictvectorizer

#sparse=false指不用稀疏矩陣表示

vec = dictvectorizer(sparse=false)

#向量化,類別型特徵轉成0/1型

x_train = vec.fit_transform(x_train.to_dict(orient='record'))

x_test = vec.fit_transform(x_test.to_dict(orient='record'))

#1.採用預設配置的隨機森林進行**

from sklearn.ensemble import randomforestclassifier

rfc = randomforestclassifier()

rfc.fit(x_train,y_train)

y_rfc_predict = rfc.predict(x_test)

print

'the accuracy of rfc on testing set is',rfc.score(x_test,y_test)

#the accuracy of rfc on testing set is 0.77811550152

#2.採用預設配置的xgboost進行**

from xgboost import xgbclassifier

xgbc = xgbclassifier()

xgbc.fit(x_train,y_train)

print

'the accuracy of xgbc on testing set is',xgbc.score(x_test,y_test)

#the accuracy of xgbc on testing set is 0.787234042553

22 高階SQL特性

1.約束為正確地進行關聯式資料庫設計,需要一種方法來保證只在表中插入合法的資料。例如,如果 orders 表儲存訂單資訊,orderitems 表儲存訂單詳細內容,應該保證 orderitems 中引用的任何訂單 id存在於 orders 中。類似地,在 orders 表中引用的任意使用者必須存在於...

OGL(教程22) 模型載入

背景知識 我們不能手動的建立複雜的模型。正如你所想象的,為每個頂點指定位置和其他的屬性,並且要在縮放的時候保持正確是不現實的。乙個盒子 金字塔或者是簡單的表面是ok的,但是對於人臉這種複雜的網格結構就不可行了。現實的世界或者是商業的應用,處理的網格模型都是通過設計師設計的模型,他們使用blender...

Vulkan學習 22 載入模型

我們暫時不使用光照,只簡單地將紋理貼在模型上。在這裡,我們載入的模型叫做 chalet hippolyte chassande baroz。我 們對它的大小和方向進行了調整 這一模型大概由 50 萬面三角形構成。大小為1.5x1.5x1.5。如果使用的模型大於這一尺寸,讀者就需要對使用的檢視矩陣進行...