Python 線性回歸模型

從線性回歸(linear regression)開始學習回歸分析，線性回歸是最早的也是最基本的模型——把資料擬合成一條直線。資料集使用scikit-learn裡的資料集boston,boston資料集很適合用來演示線性回歸。boston資料集包含了波士頓地區的房屋**中位數。還有一些可能會影響房價的因素，比如犯罪率（crime rate）。

載入資料

from sklearn import
datasets
boston =datasets.load_boston()
import
pandas as pd
import warnings #
用來忽略seaborn繪相簿產生的warnings

用scikit-learn的線性回歸非常簡單

首先，匯入linearregression類建立乙個物件：

from sklearn.linear_model import
linearregression
lr = linearregression()

現在，再把自變數和因變數傳給linearregression的fit方法：

lr.fit(boston.data, boston.target)

linearregression(copy_x=true, fit_intercept=true, n_jobs=1, normalize=false)

開始**

predictions = lr.predict(boston.data)

用**值與實際值的殘差（residuals）直方圖分布來直觀顯示**結果：

線性回歸原理

線性回歸的基本理念是找出滿足 y=xβy=xβ 的相關係數集合 ββ ，其中 xx 是因變數資料矩陣。想找一組完全能夠滿足等式的相關係數很難，因此通常會增加乙個誤差項表示不精確程度或測量誤差。因此，方程就變成了 y=xβ+ϵy=xβ+ϵ，其中 ϵϵ 被認為是服從正態分佈且與 xx 獨立的隨機變數。用幾何學的觀點描述，就是說這個變數與 xx 是正交的（perpendicular）。可以證明 e(xϵ)=0e(xϵ)=0。

為了找到相關係數集合 ββ ，我們最小化誤差項，這轉化成了殘差平方和最小化問題。

這個問題可以用解析方法解決，其解是:

Python 線性回歸模型

線性回歸模型線性回歸模型

線性回歸模型

線性回歸模型線性回歸 vs 結構方程模型

Python 線性回歸模型

線性回歸模型 線性回歸模型

線性回歸模型

線性回歸模型 線性回歸 vs 結構方程模型

相關推薦

線性回歸模型線性回歸模型

線性回歸模型線性回歸 vs 結構方程模型