多重共線性與虛擬變數

2021-07-25 12:05:39 字數 984 閱讀 9498

計量經濟學的概念都很重要。

數學語言:存在 c1

x1i+

c2x2

i+⋯+

ckxk

i=0,

i=1,

2⋯,n

即其中乙個變數可以由其他的變數表示,這就說明這個變數是多餘的;這就是多重共線性。

上式我們稱之為完全共線性,如果有 c1

x1i+

c2x2

i+⋯+

ckxk

i+vi

=0,i

=1,2

⋯,n

多了乙個常數,那麼稱之為近似共線性。

根據高等代數的知識我們可以知道,在上述情況下,矩陣

x 是不滿秩的,因此不存在 x−

1,導致最小二乘法不能估計引數。

同時也會導致方差增大,由於t檢驗需要用到方差: t=

β̂ d(

β)‾‾

‾‾‾√

方差增大後,t檢驗的值會減小,因此模型顯著性受到影響。求 x

1,x2

的相關係數

r , |r

|→1則存在強的多重共線性。

ls x1 c x2 x3 ...

ls x2 c x1 x3 ...

ls x3 c x1 x2 ...

即對每個變數進行一次回歸分析,看擬合優度 r2

, 如果它十分接近1那可以確定此變數可以由其他變數來表示,它是多餘的,模型存在多重共線性。r2

大,f 大,

t小,經驗上說明存在多重共線性。

定性因素不能加減,就用0和1來表示;這就是虛擬變數,用

d 表示。

如模型 yi

=β0+

β1xi

+β2d

i+μi

虛擬變數改變了模型的截距。yi

=β0+

β1xi

+β2d

ix2+

μi

多重共線性

多重共線性的概念 模型解釋變數之間存在完全線性相關或不完全線性相關關係 產生的原因 1 特徵變數之間的內在聯絡 2 特徵變數在時間上有同方向變動的趨勢 3 某些變數的滯後 檢驗的方法 1 相關性分析 2 方差膨脹因子 方差膨脹因子 variance inflation factor,vif 容忍度的...

r語言多重共線性 統計基礎 多重共線性

僅用於個人學習知識整理和sas r語言 python 整理 該文章首發於csdn 正在遷移優化文章中 1.定義 則稱自變數間存在完全多重共線性 2.影響 3.診斷 另外找到乙個比較詳細的診斷方法的列舉 線性回歸多重共線性的診斷方法和r語言實現 線性回歸多重共線性的診斷方法和r語言實現 資料分析與資料...

多重共線性處理方法

自變數 解釋變數 之間彼此相關的現象,我們稱這種現象為多重共線性。手動移除出共線性的變數 先做下相關分析,如果發現某兩個自變數x 解釋變數 的相關係數值大於0.7,則移除掉乙個自變數 解釋變數 然後再做回歸分析。此方法是最直接的方法,但有的時候我們不希望把某個自變數從模型中剔除,這樣就要考慮使用其他...