統計學習第十二周 回歸分析

2021-10-02 04:13:06 字數 1124 閱讀 3264

學習內容

一元線性回歸(相關關係、最小二乘法、擬合優度檢測、顯著性檢驗、回歸**、殘差分析)

多元線性回歸(多重共線性、變數選擇與逐步回歸)

一、一元線性回歸

1.相關關係

相關關係是值變數的數值之間存在這依存關係,即乙個變數的數值會隨著另乙個變數或幾個變數的數值變化而呈現出一定的變化規律。

例如:人的身高和體重的關係,居民收入增長率與物價指數的關係等等

根據相關關係的強度分類:分為完全相關,弱相關和不相關三種。

根據相關關係的方向分類:分為正相關和負相關兩種。

根據相關關係的形態分類:分為線性相關關係和非線性相關關係

也可根據相關關係的變數個數分類:分為單相關關係、復相關關係和偏相關關係。

單相關關係是指兩個變數之間的關係,分為自變數和因變數,也稱為二元變數相關分析;

復相關關係是指三個或三個以上變數之間的關係,即乙個因變數對兩個或兩個以上自變數的相關關係,也稱多重相關關係;

偏相關關係是指在乙個因變數與多個自變數相關的情況下,只關心因變數與其中乙個自變數的關係,遮蔽其他自變數對因變數的影響。

2.最小二乘法

最小二乘法(又稱最小平方法)是一種數學優化技術。它通過最小化誤差的平方和尋找資料的最佳函式匹配。利用最小二乘法可以簡便地求得未知的資料,並使得這些求得的資料與實際資料之間誤差的平方和為最小。

3.擬合度檢驗

擬合優度(goodness of fit)是指回歸直線對觀測值的擬合程度,是用來測量模型的回歸程度好壞的。擬合優度檢驗是假設檢驗的一種,用來檢測觀測數與根據模型計算得到的理論數之間的一種假設檢驗,以便於判斷該假設或模型是否與實際觀測數吻合

4.顯著性檢驗

我們知道,在假設檢驗中有兩類錯誤:

5.回歸**

回歸分析**法,是在分析市場現象自變數和因變數之間相關關係的基礎上,建立變數之間的回歸方程,並將回歸方程作為**模型,根據自變數在**期的數量變化來**因變數,關係大多表現為相關關係。

回歸**法的步驟:

6.殘差分析

殘差是指觀測值與**值(擬合值)之間的差,即是實際觀察值與回歸估計值的差。

在回歸分析中,測定值與按回歸方程**的值之差,並且殘差服從正態分佈,通常可以根據分析殘差的分布情況來校驗模型的合理性

二、多元線性回歸

統計學第十二周打卡 回歸分析

定義 變數間存在不確定數量關係,稱為相關關係。描述 正相關 負相關 完全正線性相關 完全負線性相關 非線性相關 不相關 指標 相關係數r 取值範圍 1,1 絕對值r小於0.3,為不相關 0.3 0.5之間,為低度相關 0.5 0.8,為中度相關 0.8 為重度相關。顯著性檢驗 因為r是計算樣本資料的...

統計學習第十三周 回歸分析實踐

學習內容 汽車銷量資料建模 汽車銷量與什麼因素有關?判斷是否存在有特徵值裡面含有空值 從上面可以看出特徵值中,公路里程數存在空值。將特徵中的空值用均值進行填充 data 公路里程數 data 公路里程數 fillna data 公路里程數 mean 劃分資料,將資料分為特徵資料和標籤資料。取特徵資料...

第十二周學習週報

第十二周學習週報 2018.11.19 11.25 一 本週學習情況 1 本週主要對之前所學內容進行總結以及匯報 2 針對本次網際網路比賽組員進行了不同內容的學習 3 李若凡對控溫風扇這方面的知道進行學習並製作出實物 4 席雷 王立峰對密碼鎖這方面的知識進行學習並做出實物 5 應琦對指紋打卡的內容進...