統計學基礎之方差分析

2022-07-15 10:00:21 字數 2235 閱讀 9326

一、基本概念

二、型別:

1、單因素方差分析

2、雙因素方差分析

3、協方差分析

一、基本概念

方差分析又稱「變異數分析」或「f檢驗」,用於兩個及兩個以上樣本均數差別的顯著性檢驗。

(1) 實驗條件,即不同的處理造成的差異,稱為組間差異。用變數在各組的均值與總均值之偏差平方和的總和表示,記作ssb,組間自由度dfb。

(2) 隨機誤差,如測量誤差造成的差異或個體間的差異,稱為組內差異,用變數在各組的均值與該組內變數值之偏差平方和的總和表示, 記作ssw,組內自由度dfw。

總偏差平方和 sst = ssb + ssw。

組內ssw、組間ssb除以各自的自由度(組內dfw =n-m,組間dfb=m-1,其中n為樣本總數,m為組數),得到其均方msw和msb,一種情況是處理沒有作用,即各組樣本均來自同一總體,msb/msw≈1。另一種情況是處理確實有作用,組間均方是由於誤差與不同處理共同導致的結果,即各樣本來自不同總體。那麼,msb>>msw(遠遠大於)。

msb/msw比值構成f分布。用f值與其臨界值比較,推斷各樣本是否來自相同的總體。

二、型別:

1、單因素方差分析

是用來研究乙個控制變數的不同水平是否對觀測變數產生了顯著影響。研究單個因素對觀測變數的影響,因此稱為單因素方差分析。

例如,分析不同施肥量是否給農作物產量帶來顯著影響,考察地區差異是否影響婦女的生育率,研究學歷對工資收入的影響等。這些問題都可以通過單因素方差分析得到答案。

單因素方差分析的第一步是明確觀測變數和控制變數。例如,上述問題中的觀測變數分別是農作物產量、婦女生育率、工資收入;控制變數分別為施肥量、地區、學歷。

單因素方差分析的第二步是剖析觀測變數的方差。方差分析認為:觀測變數值的變動會受控制變數和隨機變數兩方面的影響。據此,單因素方差分析將觀測變數總的離差平方和分解為組間離差平方和和組內離差平方和兩部分,用數學形式表述為:sst=ssa+sse。

單因素方差分析的第三步是通過比較觀測變數總離差平方和各部分所佔的比例,推斷控制變數是否給觀測變數帶來了顯著影響。

原理:

在觀測變數總離差平方和中,如果組間離差平方和所佔比例較大,則說明觀測變數的變動主要是由控制變數引起的,可以主要由控制變數來解釋,控制變數給觀測變數帶來了顯著影響;反之,如果組間離差平方和所佔比例小,則說明觀測變數的變動不是主要由控制變數引起的,不可以主要由控制變數來解釋,控制變數的不同水平沒有給觀測變數帶來顯著影響,觀測變數值的變動是由隨機變數因素引起的。

基本分析步驟

1、提出原假設:h0——無差異;h1——有顯著差異

2、選擇檢驗統計量:方差分析採用的檢驗統計量是f統計量,即f值檢驗。

3、計算檢驗統計量的觀測值和概率p值:該步驟的目的就是計算檢驗統計量的觀測值和相應的概率p值。

4、給定顯著性水平,並作出決策

2、雙因素方差分析

多因素方差分析用來研究兩個及兩個以上控制變數是否對觀測變數產生顯著影響。研究多個因素對觀測變數的影響,因此稱為多因素方差分析。多因素方差分析不僅能夠分析多個因素對觀測變數的獨立影響,更能夠分析多個控制因素的互動作用能否對觀測變數的分布產生顯著影響,進而最終找到利於觀測變數的最優組合。

例如:分析不同品種、不同施肥量對農作物產量的影響時,可將農作物產量作為觀測變數,品種和施肥量作為控制變數。利用多因素方差分析方法,研究不同品種、不同施肥量是如何影響農作物產量的,並進一步研究哪種品種與哪種水平的施肥量是提高農作物產量的最優組合。

進一步分析:

1、建立非飽和模型

2、均值比較分析

3、控制變數互動作用的圖形分析

3、協方差分析

協方差分析將那些人為很難控制的控制因素作為協變數,並在排除協變數對觀測變數影響的條件下,分析控制變數(可控)對觀測變數的作用,從而更加準確地對控制因素進行評價。

協方差分析仍然沿承方差分析的基本思想,並在分析觀測變數變差時,考慮了協變數的影響,人為觀測變數的變動受四個方面的影響:即控制變數的獨立作用、控制變數的互動作用、協變數的作用和隨機因素的作用,並在扣除協變數的影響後,再分析控制變數的影響。

方差分析中的原假設是:協變數對觀測變數的線性影響是不顯著的;在協變數影響扣除的條件下,控制變數各水平下觀測變數的總體均值無顯著差異,控制變數各水平對觀測變數的效應同時為零。檢驗統計量仍採用f統計量,它們是各均方與隨機因素引起的均方比

統計學之方差分析

方差分析 analysis of variance,簡稱anova 是用於兩個及兩個以上樣本均數差別的顯著性檢驗。方差分析中,由於各種因素的影響,研究所得的資料呈現波動狀,這種波動可以分為組間波動和組內波動兩種情況。單因素方差分析 食物1食物2食物335 5236 147均值 2 均值 4 均值 6...

統計學 方差分析

單因素方差分析 問題 行業不同是否影響被投訴次數?說明 零售業對應列的7個資料是七個不同 零售業的 公司各自的被投訴次數,其他行業及其資料類似。使用excel進行單方差分析 首先在excel中新增載入項 資料分析 資料 選項卡,分析 資料分析 對話方塊,選擇 方差分析 單因素方差分析 在對話方塊設定...

統計學 統計學基礎

五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...