R語言 資料分析 多重共線性問題

2021-08-03 21:02:49 字數 1342 閱讀 7612

1、什麼是多重共線性?

多重共線性(multicollinearity)是指線性回歸模型中的解釋變數之間由於存在精確相關關係或高度相關關係而使模型估計失真或難以估計準確。

2、多重共線性對回歸模型的影響

@1、完全共線性下引數估計量不存在

@2、近似共線性下ols估計量非有效

@3、引數估計量經濟含義不合理

@4、變數的顯著性檢驗失去意義,可能將重要的解釋變數排除在模型之外

@5、模型的**功能失效。變大的方差容易使區間**的「區間」變大,使**失去意義。

3、利用計算特徵根發現多重共線性

5、多重共線性解決辦法

(1)排除引起共線性的變數

找出引起多重共線性的解釋變數,將它排除出去,以逐步回歸法得到最廣泛的應用。

(2)差分法

時間序列資料、線性模型:將原模型變換為差分模型。

(3)減小引數估計量的方差:嶺回歸法(ridge regression)。

######

######

######

######

##r語言分析##############################

rm(list=ls())

gc()

head(longley)

view(longley)

str(longley)

summary(longley)

######

######

####研究變數之間是否存在共線性###

######

######

######

#xx <- cor(longley[2:7])

#如果以gnp.deflator作為因變數y ,研究其餘6個變數是否存在多重共線性

# 基本原理是通過研究矩陣的最大特徵值和最小特徵值之間的比值。具體如下:

#####這個比值如果大於1000,變數之間存在嚴重的多重共線性###

######

######

#######

######

#####計算特徵值和特徵向量###

######

######

#######

######

######

##利用計算特徵根發現多重共線性#############

eigen(xx)

####可將其中乙個線性相關的變數提出,解決多重線性回歸###

######

#

r語言多重共線性 統計基礎 多重共線性

僅用於個人學習知識整理和sas r語言 python 整理 該文章首發於csdn 正在遷移優化文章中 1.定義 則稱自變數間存在完全多重共線性 2.影響 3.診斷 另外找到乙個比較詳細的診斷方法的列舉 線性回歸多重共線性的診斷方法和r語言實現 線性回歸多重共線性的診斷方法和r語言實現 資料分析與資料...

多重共線性

多重共線性的概念 模型解釋變數之間存在完全線性相關或不完全線性相關關係 產生的原因 1 特徵變數之間的內在聯絡 2 特徵變數在時間上有同方向變動的趨勢 3 某些變數的滯後 檢驗的方法 1 相關性分析 2 方差膨脹因子 方差膨脹因子 variance inflation factor,vif 容忍度的...

多重共線性處理方法

自變數 解釋變數 之間彼此相關的現象,我們稱這種現象為多重共線性。手動移除出共線性的變數 先做下相關分析,如果發現某兩個自變數x 解釋變數 的相關係數值大於0.7,則移除掉乙個自變數 解釋變數 然後再做回歸分析。此方法是最直接的方法,但有的時候我們不希望把某個自變數從模型中剔除,這樣就要考慮使用其他...