資料分析的統計方法選擇小結 變數之間的關聯性分析

2021-08-08 04:16:27 字數 1330 閱讀 2844

一、兩個變數之間的關聯性分析

1.兩個變數均為連續型變數

1)小樣本並且兩個變數服從雙正態分佈,則用pearson相關係數做統計分析

2)大樣本或兩個變數不服從雙正態分佈,則用spearman相關係數進行統計分析

2.兩個變數均為有序分類變數,可以用spearman相關係數進行統計分析

3.乙個變數為有序分類變數,另乙個變數為連續型變數,可以用spearman相關係數進行統計分析

二、回歸分析

1.直線回歸:如果回歸分析中的殘差服從正態分佈(大樣本時無需正態性),殘差與自變數無趨勢變化,則直線回歸(單個自變數的線性回歸,稱為簡單回歸),否則應作適當的變換,使其滿足上述條件。

2.多重線性回歸:應變數(y)為連續型變數(即計量資料),自變數(x1,x2,…,xp)可以為連續型變數、有序分類變數或二分類變數。如果回歸分析中的殘差服從正態分佈(大樣本時無需正態性),殘差與自變數無趨勢變化,可以作多重線性回歸。

1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素

2)實驗性研究:在保持主要研究因素變數(干預變數)外,可以適當地引入一些其它可能的混雜因素變數,以校正這些混雜因素對結果的混雜作用

3.二分類的logistic回歸:應變數為二分類變數,自變數(x1,x2,…,xp)可以為連續型變數、有序分類變數或二分類變數。

1)非配對的情況:用非條件logistic回歸

(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素

(2)實驗性研究:在保持主要研究因素變數(干預變數)外,可以適當地引入一些其它可能的混雜因素變數,以校正這些混雜因素對結果的混雜作用

2)配對的情況:用條件logistic回歸

(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素

(2)實驗性研究:在保持主要研究因素變數(干預變數)外,可以適當地引入一些其它可能的混雜因素變數,以校正這些混雜因素對結果的混雜作用

4.有序多分類有序的logistic回歸:應變數為有序多分類變數,自變數(x1,x2,…,xp)可以為連續型變數、有序分類變數或二分類變數。

1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素

2)實驗性研究:在保持主要研究因素變數(干預變數)外,可以適當地引入一些其它可能的混雜因素變數,以校正這些混雜因素對結果的混雜作用

5.無序多分類有序的logistic回歸:應變數為無序多分類變數,自變數(x1,x2,…,xp)可以為連續型變數、有序分類變數或二分類變數。

1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素

2)實驗性研究:在保持主要研究因素變數(干預變數)外,可以適當地引入一些其它可能的混雜因素變數,以校正這些混雜因素對結果的混雜作用。

如何根據變數型別選擇資料分析方法?

引自 itongji.cn 面對大量資料,你將如何開展資料分析 您會選擇什麼樣的資料分析 方法呢?您是否看著資料感到迷茫,無所適從。認真讀完這篇文章,或許你將有所收穫。1 抓住業務問題不放鬆。您費大力氣收集資料的動機是什麼?你想解決什麼問題?這是核心,是方向,這是業務把握層面。2 全面理解資料。哪些...

如何根據變數型別選擇資料分析方法

如何根據變數型別選擇資料分析方法 面對大量資料,資料分析師將如何開展資料分析?您會選擇什麼樣的資料分析方法呢?您是否看著資料感到迷茫,無所適從。認真讀完這篇文章,或許你將有所收穫。把握兩個關鍵 1 抓住業務問題不放鬆。您費大力氣收集資料的動機是什麼?你想解決什麼問題?這是核心,是方向,這是業務把握層...

資料分析統計

select count 0 sum oi.aunt 10 to char oi.cre date,yyyy mm dd hh24 d count to char oi.crea date,yyyy mm dd hh24 c from eall.orer ite oi where oi.cratda...