多元線性回歸模型檢驗續上篇

只要有p值的出現，樣本量不超過5000，比如線性回歸和邏輯回歸；搞清楚演算法背後的邏輯才是比較重要的。

多元線性回歸需要關注一些什麼點？r2和模型穩定性，也就是那些β是不是穩定的，檢驗模型是不是穩定需要對模型進行診斷。

多元線性回歸的輸出變數是連續變數，輸入變數中如果包含離散變數需要做啞變數或one-hot編碼，連續變數可以直接用來建模。

如果擾動項是右偏，那麼殘差圖肯定是異方差分布，取對數即可，所以下圖中假設5和假設4可以說是一致的。

（1）殘差分析：實際上當殘差不包含任何資訊的時候是最好的，如果還包含一些資訊，需要把這個資訊提取出來。殘差圖的縱座標是殘差，橫座標可以是各個解釋變數x，實際上在做單變數分析，解釋變數x被解釋變數y做相關性分析的時候就知道了；比如某個解釋變數x和被解釋變數y都是右偏，那麼殘差圖肯定是異方差，同時取對數重新建模；如果某個解釋變數x和被解釋變數y存在拋物線關係，那麼加入二次項重新進行建模；自相關一般在時間序列資料中比較常見。

（2）強影響點分析：

為什麼要做強影響點分析？？？因為有了強影響點的存在之後，會把本來沒有關係的資料帶出關係來，而且這個關係特別不穩定。比如下圖，本來資料點之間沒有什麼關係，但是因為強影響點的存在之後，給資料帶出來了這麼乙個線性關係出來，但這個關係是非常不穩定的，不具有大眾性。

怎麼解決強影響點分析問題？？？學生化殘差（只做一次）。

|sr| = (殘差 - 殘差均值) / 殘差標準差。

|sr| > 2，剔除掉滿足條件的記錄（幾百個樣本）

|sr| > 3，剔除掉滿足條件的記錄（幾千個樣本）

（3）共線性問題

多元線性回歸模型檢驗續上篇

多元線性回歸模型的F檢驗

多元線性回歸資料集多元線性回歸函式的檢驗

線性模型 1 多元線性回歸

多元線性回歸模型檢驗 續上篇

多元線性回歸模型的F檢驗

多元線性回歸資料集 多元線性回歸函式的檢驗

線性模型 1 多元線性回歸

相關推薦

多元線性回歸模型檢驗續上篇

多元線性回歸資料集多元線性回歸函式的檢驗