機器學習 共享的單車實戰演練

2021-09-26 01:12:02 字數 2366 閱讀 3676

1.拿到這個資料需要刪除那些沒有用的列,比如序號

2.進行獨熱編碼

3.進行多項式擴充套件

4.標準化

5.切分資料集

6.建立模型求出資料

import pandas as pd

from sklearn.model_selection import train_test_split

from sklearn.linear_model import linearregression, ridge

from sklearn.preprocessing import onehotencoder, polynomialfeatures, standardscaler

# 讀取資料

path =

'../../datas/hour.csv'

data = pd.read_csv(path)

# 處理資料

# 刪除無用列

data.drop(columns=

["instant"

,"dteday"

,"casual"

,"registered"

], inplace=

true

)# 獨熱編碼

# 提取要進行獨熱編碼的列

hot = data[

["season"

,"mnth"

,"hr"

,"weekday"]]

hotcoder = onehotencoder(sparse=

false

)hot = pd.dataframe(hotcoder.fit_transform(hot)

)# 刪除掉獨熱編碼的列

data.drop(columns=

["season"

,"mnth"

,"hr"

,"weekday"

], inplace=

true

)# 多項式擴充套件

ploy = data[

["weathersit"

,"temp"

,"atemp"

,"hum"

,"windspeed"]]

ploycoder = polynomialfeatures(degree=

2, interaction_only=

false

, include_bias=

false

)ploy = pd.dataframe(ploycoder.fit_transform(ploy)

, columns=ploycoder.get_feature_names())

# 標準化

sscoder = standardscaler(

)ploy = pd.dataframe(sscoder.fit_transform(ploy)

, columns=ploycoder.get_feature_names())

# 刪掉多項式擴充套件的列

data.drop(columns=

["weathersit"

,"temp"

,"atemp"

,"hum"

,"windspeed"

], inplace=

true

)# 合併

df = pd.concat(

[hot, ploy, data]

, axis=1)

# 構建xy

x = df.iloc[:,

:-1]

y = df.iloc[:,

[-1]

]# 切分資料集

train_x, test_x, train_y, test_y = train_test_split(x, y, test_size=

0.3, random_state=2)

# 訓練linearregression模型

model = linearregression(

)model.fit(train_x, train_y)

print

('linearregression精度為:'

, model.score(test_x, test_y)

)# 訓練ridge模型

model = ridge(

)model.fit(train_x, train_y)

print

('ridge精度為:'

, model.score(test_x, test_y)

)

linearregression精度為: 0.695209732049

ridge精度為: 0.695128876927

機器學習之共享單車使用量專案設計

刪除無用的列 df.drop columns instant dteday casual registered inplace true 獨熱編碼,對需要進行獨熱編碼的列編碼 hot df season mnth hr weekday hotcoder onehotencoder sparse fa...

共享單車的討論

共享單車的利弊 我的觀點 方便 方便 還是方便 停放 停放 還是要停放 亂不 亂不 還是有點亂 管理 你好!這是你第一次使用markdown編輯器所展示的歡迎頁。如果你想學習如何使用markdown編輯器,可以仔細閱讀這篇文章,了解一下markdown的基本語法知識。全新的介面設計,將會帶來全新的寫...

機器學習實戰

花了一段時間,總算把 機器學習實戰 粗讀了一遍,重點就在這個粗讀上。這本書的確不錯,機器學習的幾個經典演算法都涉及了,每個演算法都有1 2個實際例子進行說明,都有實實在在的 讓我想起了linus的 talk is cheap,show me the code 那句名言。但多年來養成的習慣,從來都是喜...