19種回歸分析你知道幾種呢?

2021-09-19 06:04:35 字數 2351 閱讀 9483

只要學習過資料分析,或者對資料分析有一些簡單的了解,比如使用過spssau、spss這些統計分析軟體,都知道有回歸分析。按照數學上的定義來看,回歸分析指研究一組隨機變數(y1 ,y2 ,…,yi)和另一組(x1,x2,…,xk)變數之間關係的統計分析方法,又稱多重回歸分析。通常y1,y2,…,yi是因變數,x1、x2,…,xk是自變數。

其實說簡單點就是研究x對於y的影響關係,這就是回歸分析。但是,這並不夠呢,看下圖,總共19種回歸(其實還有不單獨列出),這如何區分,到底應該使用哪一種回歸呢,這19種回歸分析有啥區別呢。為什麼會這如此多的回歸分析呢?

一、首先回答下:為什麼會有如此多的回歸分析方法?

在研究x對於y的影響時,會區分出很多種情況,比如y有的是定類資料,y有的是定量資料(如果不懂的童鞋可檢視

spssau官網幫助手冊

),也有可能y有多個或者1個,同時每種回歸分析還有很多前提條件,如果不滿足則有對應的其它回歸方法進行解決。這也就解決了為什麼會有如此多的回歸分析方法。接下來會逐一說明這19種回歸分析方法。

二、回歸分析按資料型別分類

首先將回歸分析中的y(因變數)進行資料型別區分,如果是定量且1個(比如身高),通常我們會使用線性回歸,如果y為定類且1個(比如是否願意購買蘋果手機),此時叫logistic回歸,如果y為定量且多個,此時應該使用pls回歸(即偏最小二乘回歸)

線性回歸

再細分:如果回歸模型中x僅為1個,此時就稱為簡單線性回歸或者一元線性回歸;如果x有多個,此時稱為多元線性回歸。

logistic回歸再細分:如果y為兩模擬如0和1(比如1為願意和0為不願意,1為購買和0為不購買),此時就叫

二元logistic回歸

;如果y為多模擬如1,2,3(比如dell, thinkpad, mac),此時就會

多分類logistic回歸

;如果y為多類且有序比如1,2,3(比如1為不願意,2為中立,3為願意),此時可以使用有序logistic回歸。如果y為兩類時,有時候會使用

二元probit回歸模型。

除此之外,如果y為定量且為多個,很多時候會將y合併概括成1個(比如使用平均值),然後使用線性回歸,反之可考慮使用pls回歸(但此種情況使用其實較少,pls回歸模型非常複雜)。

三、深入說明線性因歸模型

我們常見的回歸分析中,線性回歸和logistic回歸最為常見。也是當前研究最多,並且使用最為普遍,以及最為人接受容易理解的研究方法。

尤其是線性回歸,其使用最為成熟,研究最多,而且絕大多數生活現象均可使用線性回歸進行研究,因而結合回歸分析還會多出一些回歸方法;同時回歸分析模型會有很多假定,或者滿足條件,如果不滿足這些假定或者條件就會導致模型使用出錯,此時就有對應的其它回歸模型出來解決這些問題,因而跟著線性回歸後面又出來很多的回歸。如下圖:

線性回歸是研究x對於y的影響,如果說有多個x,希望讓模型自動找出有意義的x,此時就可以使用逐步回歸。另外在很一些管理類研究中會涉及到中介作用或者調節作用,此時就可能使用到分層回歸或者分組回歸等。

在進行線性回歸分析時,如果說模型出現共線性問題vif值很大,此時就可以使用嶺回歸進行解決,

嶺回歸的使用較為廣泛,其實還有lasso回歸也可以解決共線性問題,但是使用非常少而已。

如果資料中有異常值,常見的解決辦法是先把異常值去除掉,但有的時候確實無法去除掉異常值,此時可考慮使用穩健回歸分析模型。

線性回歸的前提是x和y之間有著線性關係,但有的時候x和y並不是線性關係,此時就有著曲線回歸和非線性回歸這兩種回歸出來供使用,曲線回歸其實質上是將曲線模型表示式轉換成線性關係表示式進行研究,而非線性回歸較為複雜當然使用也非常少,其和線性回歸完全不是一回事情。以及

poisson回歸(泊松回歸)

是指y符合泊松分布特徵時使用的回歸研究模型。

四、其它

除此之外,還有比如加權wls回歸等,使用較少,不單獨說明。

最後特別說明的一種回歸模型叫cox回歸,這是醫學研究中使用較多的一種方法,是研究生存影響關係,比如研究抑鬱症生存時間,癌症的死亡時間影響關係情況等。

綜上所述,一次性將19種回歸彙總,基本上都可以在spssau上面找到,關於各類回歸方法的使用,以及具體原理,可檢視

spssau官網

,以及可使用spssau上面的

案例資料

,逐一進行操作分析。

MySQL索引,你知道有幾種型別呢?

一 簡介 mysql目前主要有以下幾種索引型別 1.普通索引 2.唯一索引 3.主鍵索引 4.組合索引 5.全文索引 二 語句 create table table name col name data type unique fulltext index key index name asc de...

MySQL索引,你知道有幾種型別呢?

一 簡介 mysql目前主要有以下幾種索引型別 1.普通索引 2.唯一索引 3.主鍵索引 4.組合索引 5.全文索引 二 語句 create table table name col name data type unique fulltext index key index name asc de...

陣列 去除重複項的方法 你知道幾種呢?

array.from方法可以將set結構轉為陣列 let items new set 1,2,3,4,5 let array array.from items 這就是提供了一種資料去重的方法 function uniq array uniq 1,2,3,3 1,2,3 運用擴充套件運算子 提供了一種...