R語言學習之簡單線性回歸

2021-07-16 05:06:08 字數 2030 閱讀 3969

從許多方面來看,回歸分析都是統計學的核心。它其實是乙個廣義的概念,通指那些用乙個或多個**變數(也稱自變數或解釋變數)來**響應變數(也稱因變數、效標變數或結果變數)的方法。即通過已知的點來建立擬合模型,用給定的x值來**y值,找到一條合適的擬合曲線,算出合適的斜率和方差。只有乙個自變數的情況稱為簡單回歸,大於乙個自變數情況的叫做多元回歸。

線性模型:

0和β1是回歸係數,

ε表示誤差。

在r中,擬合線性模型最基本的函式就是lm()。

例項:物理學家

james.d

.forbes

試圖通過水的沸點來估計海拔高度,他知道通過氣壓計測得的大氣壓可用於得到海拔高度,氣壓越低,高度越高,他測量了

17個地方水的沸點(℉)及大氣壓資料,並且對資料作了簡單的處理,得到了較為明確的數學關係,所提資料如下:

首先錄入資料:

x=matrix(c(194.5,20.79,1.3179,131.79,194.3,20.79,1.3179,131.79,197.9,22.40,1.3502,

135.02,198.4,22.67,1.3555,135.55,199.4,23.15,1.3646,136.46,199.9,23.35,

1.3683,136.83,200.9,23.89,1.3782,137.82,201.1,23.99,1.3800,138.00,201.4,

24.02,1.3806,138.06,201.3,24.01,1.3805,138.05,203.6,25.14,1.4004,140.04,

204.6,26.57,1.4244,142.44,209.5,28.49,1.4547,145.47,208.6,27.76,1.4434,

144.34,210.7,29.04,1.4630,146.30,211.9,29.88,1.4754,147.54,212.2,30.06,

1.4780,147.80),ncol=4,byrow=t,dimnames=list(1:17,c('f','h','log','log100')))

資料結果為:

#強制轉換為資料框

plot(forbes$f,forbes$log100) #檢視f和log100之間的關係

lm.sol=lm(log100~f,data=forbes) #擬合模型

可以得出**模型為:

y = -42.13087 + 0.89546x

殘差分析:

由圖中可發現 12 那點偏離比較遠,對結果影響較大,可以把奇異點剔除掉。

模型診斷:

用R語言做簡單線性回歸和指數線性回歸

x y首先先計算他們的相關性 cor x,y 值為 0.964 fitcoef fit 檢視回歸函式係數結果為 intercept x 2.082360e 05 1.494401e 02 所謂線性回歸就是 y a bx 求a,b的值。結果中,a值就是intercept截距值,b值為第二個x系數值。我...

R語言學習筆記 8 線性回歸

erg tutorial 3 linear model a lm medv lstat i lstat 2 date boston 對lstat和lstat 2進行線性回歸 a lm medv poly lstat,5 date boston 對lstat,lstat 2 lstat 3進行線性回歸...

簡單線性回歸

真實值 y theta x varepsilon 值 hat theta x varepsilon 為誤差 項,服從 均值為0 方差為 為誤差項,服從均值為0,方差為 為誤差項,服 從均值為 0,方差 為 sigma 的高斯分布。已知若干樣本,可以得到若干 varepsilon 值,根 據極大似 然...