機器學習演算法03 線性回歸演算法實戰

2021-10-08 09:43:52 字數 1814 閱讀 7238

摘要:本文主要介紹線性回歸演算法的定義,公式,回歸實戰。

用來對連續性資料進行**,來確定兩種或者兩種以上變數間的相互關係。

換句話說,它是一種用於資料擬合的工具,從許多資料中找到一條直線能夠擬合含大部分資料,從而可以根據輸入的值**輸出的值。

線性是指擬合的資料是呈線性的,而回歸是指可根據以前的資料**出乙個準確的輸出。

1.訓練模型和**結果

import numpy as np

import pandas as pd

from sklearn.datasets import load_boston

from sklearn.model_selection import train_test_split

from sklearn.linear_model import linearregression

from sklearn.preprocessing import standardscaler

boston = load_boston()

x = boston.data

y = boston.target

train_x,test_x,train_y,test_y = train_test_split(x,y,test_size=0.2,random_state=0)

#資料標準化處理 結果比沒有處理的模型效果差

# stand = standardscaler()

# train_x = stand.fit_transform(train_x)

# test_x = stand.fit_transform(test_x)

lr = linearregression()

lr.fit(train_x,train_y)

result = lr.predict(test_x)

2.模型效能

#模型效能   0.6左右 比較差

from sklearn.metrics import r2_score

ls_sc = r2_score(test_y,result)

print(ls_sc)

3.視覺化資料,這裡顯示實際值和**值的比較折線圖。

import matplotlib

import matplotlib.pyplot as plt

#繪圖#設定畫布大小

4.視覺化資料,使用x的乙個維度,第一張圖取0,第二張圖取1,0和1分別代表不同的特徵;來顯示**結果;紅色的data是訓練集結果,藍色的true是**資料真實值,綠色五角星是模型**值;這裡主要關注藍色和綠色的符合程度,符合度高,模型效果越好。

機器學習演算法之線性回歸

有監督學習 學習樣本為 d xi,yi n i 1 輸出 的結果yi為連續值變數 需要學習對映 y 假定輸入x和輸出y之間有線性相關關係 對於給定的x,其輸出y f x wt x b 可以利用最小二乘法對w和b進行估計 根據自變數個數可以將線性回歸主要分為兩種 一元線性回歸和多元線性回歸。一元線性回...

機器學習演算法 線性回歸

線性回歸應該算機器學習演算法裡面最基礎的演算法了,分別用作回歸 y值為連續值 和分類 y值為離散 在學習線性回歸的過程中,有很多機器學習的概念和方法是在這時候提出的。在現實中變數之間的關係,是有確定的和非確定的。確定關係指的是變數之間可以使用函式關係式表示,非確定的部分我們可以用概率分布來表示,如乙...

機器學習演算法 線性回歸

樣本特徵只有乙個的線性回歸問題,為簡單線性回歸。樣本特徵有多個的線性回歸問題,為多元線性回歸。兩個變數之間的關係是一次函式關係的 圖象是直線,這樣的兩個變數之間的關係就是 線性關係 如果不是一次函式關係的 圖象不是直線,就是 非線性關係 線性回歸演算法將無數的訓練集資料放在乙個座標系中,以座標系的乙...