sklearn學習記錄

2021-09-22 01:37:35 字數 2864 閱讀 5610

使用python簡單的獲取資料、處理資料、資料**

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

from sklearn.svm.classes import svc

from pil.imageenhance import color

from sklearn import datasets

from sklearn.model_selection import train_test_split

from sklearn import preprocessing

from sklearn.model_selection import validation_curve

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import linearregression

from matplotlib import rcparams

from sklearn.linear_model import logisticregression

# 引入資料集,使用自帶的紅酒資料集

wine = datasets.load_wine(

)# x表示樣本的特徵值

x = wine.data

# y表示樣品的類別

y = wine.target

# 對資料進行標準化預處理

scaler = preprocessing.standardscaler(

).fit(x)

scaler.transform(x)

# 將每個特徵值固定到乙個固定範圍

scaler = preprocessing.minmaxscaler(feature_range=(0

,1))

.fit(x)

scaler.transform(x)

# 利用sklearn提供的train_test_split方法,將資料集劃分為測試集和訓練集

# 測試集和訓練集的比例為3:7

x_train, x_test, y_train, y_test = train_test_split(

x, y, test_size=

0.3, random_state=42)

print

('測試集:'

, y_test)

# 定義線性回歸模型

model1 = linearregression(

).fit(x_train, y_train)

predict1 = model1.predict(x_test)

print

('線性模型**前20個結果為:'

,'\n'

, predict1[:20

])# 定義邏輯回歸模型

model2 = logisticregression(penalty=

'l2'

, dual=

false

, tol=

0.0001

, c=

1.0,

fit_intercept=

true

, intercept_scaling=

1, class_weight=

none

, random_state=

none

, solver=

'liblinear'

, max_iter=

100, multi_class=

'ovr'

, verbose=

0, warm_start=

false

, n_jobs=1)

model2.fit(x_train, y_train)

predict2 = model2.predict(x_test)

print

('邏輯回歸模型**前20個結果為:'

,'\n'

, predict2[:20

])rcparams[

'font.sans-serif']=

'simhei'

fig = plt.figure(figsize=(10

,6))

# 設定空白畫布,並制定大小

# 用不同的顏色表示不同資料

plt.plot(

range

(y_test.shape[0]

), y_test,

color=

"blue"

, linewidth=

1.5, linestyle=

"-")

# 線性回歸模型繪圖

plt.plot(

range

(y_test.shape[0]

), predict1,

color=

"red"

, linewidth=

1.5, linestyle=

"-."

)# 邏輯回歸模型繪圖

plt.plot(

range

(y_test.shape[0]

), predict2,

color=

"yellow"

, linewidth=

1, linestyle=

"-."

)plt.legend(

['真實值'

,'線性回歸模型**值'

,'邏輯回歸模型**值'])

plt.show(

)

學習記錄 sklearn線性回歸

本文旨在記錄colin老師workshop的exercise1講解,包含入門級的sklearn操作 首先導入庫 import numpy as np import pandas as pd import scipy.stas as stats import sklearn 其次匯入資料,這裡使用的是...

sklearn學習目錄(學習記錄)

隨機森林 決策樹神經網路演算法 強化學習 sklearnapi api使用方法 找模型 注意區分是連續還是離散 檢視模型的引數 檢視模型的屬性和方法 模型使用方法 例項化模型 匯入測試資料 fit 得到評分 score 根據評分或交叉驗證結果調整引數 著重介紹決策樹和隨機森林的使用 調參 交叉驗證 ...

sklearn學習 sklearn學習的相關資料

0 scikit learn官網 1 使用sklearn進行整合學習 理論 2 使用sklearn進行整合學習 實踐 3 sklearn學習筆記之開始 4 誰動了我的特徵?sklearn特徵轉換行為全記錄 5 使用sklearn優雅地進行資料探勘 備註 作者是個大神 6 sklearn多個例項 7 ...