方差分析anova

2022-05-10 16:23:41 字數 1781 閱讀 7827

參考:

方差分析(analysis of variance,簡稱anova)

方差分析(anova)又稱「變異數分析」或「f檢驗」,是r.a.fister發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。

由於各種因素的影響,研究所得的資料呈現波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。

乙個複雜的事物,其中往往有許多因素互相制約又互相依存。方差分析的目的是通過資料分析找出對該事物有顯著影響的因素,各因素之間的互動作用,以及顯著影響因素的最佳水平等。方差分析是在可比較的陣列中,把資料間的總的「變差」按各指定的變差**進行分解的一種技術。對變差的度量,採用離差平方和。方差分析方法就是從總離差平方和分解出可追溯到指定**的部分離差平方和,這是乙個很重要的思想。

經過方差分析若拒絕了檢驗假設,只能說明多個樣本總體均數不相等或不全相等。若要得到各組均數間更詳細的資訊,應在方差分析的基礎上進行多個樣本均數的兩兩比較。

1、多個樣本均數間兩兩比較

多個樣本均數間兩兩比較常用q檢驗的方法,即newman-kueuls法,其基本步驟為:建立檢驗假設-->樣本均數排序-->計算q值-->查q界值表判斷結果。

2、多個實驗組與乙個對照組均數間兩兩比較

多個實驗組與乙個對照組均數間兩兩比較,若目的是減小第ii類錯誤,最好選用最小顯著差法(lsd法);若目的是減小第i類錯誤,最好選用新復極差法,前者查t界值表,後者查q'界值表。

[編輯]

下面我們用乙個簡單的例子來說明方差分析的基本思想:

如某克山病區測得11例克山病患者和13名健康人的血磷值(mmol/l)如下:

問該地克山病患者與健康人的血磷值是否不同?

而且:ss總=ss組間+ss組內 v總=v組間+v組內

如果用均方(即自由度v去除離均差平方和的商)代替離均差平方和以消除各組樣本數不同的影響,則方差分析就是用組內均方去除組間均方的商(即f值)與1相比較,若f值接近1,則說明各組均數間的差異沒有統計學意義,若f值遠大於1,則說明各組均數間的差異有統計學意義。實際應用中檢驗假設成立條件下f值大於特定值的概率可通過查閱f界值表(方差分析用)獲得。

[編輯]

應用方差分析對資料進行統計推斷之前應注意其使用條件,包括:

1、可比性。若資料中各組均數本身不具可比性則不適用方差分析。

2、正態性。即偏態分布資料不適用方差分析。對偏態分布的資料應考慮用對數變換、平方根變換、倒數變換、平方根反正弦變換等變數變換方法變為正態或接近正態後再進行方差分析。

3、方差齊性。即若組間方差不齊則不適用方差分析。多個方差的齊性檢驗可用bartlett法,它用卡方值作為檢驗統計量,結果判斷需查閱卡方界值表。

方差分析主要用於:

1、均數差別的顯著性檢驗;

2、分離各有關因素並估計其對總變異的作用;

3、分析因素間的互動作用;

4、方差齊性檢驗。

[編輯]

根據資料設計型別的不同,有以下兩種方差分析的方法:

1、對成組設計的多個樣本均數比較,應採用完全隨機設計的方差分析,即單因素方差分析。

2、對隨機區組設計的多個樣本均數比較,應採用配伍組設計的方差分析,即兩因素方差分析。

兩類方差分析的基本步驟相同,只是變異的分解方式不同,對成組設計的資料,總變異分解為組內變異和組間變異(隨機誤差),即:ss總=ss組間+ss組內,而對配伍組設計的資料,總變異除了分解為處理組變異和隨機誤差外還包括配伍組變異,即:ss總=ss處理+ss配伍+ss誤差。整個方差分析的基本步驟如下:

1、建立檢驗假設;

檢驗水準為0.05。

2、計算檢驗統計量f值;

3、確定p值並作出推斷結果。

方差分析 ANOVA

方差分析是為了比較多個總體樣本均數是否存在差別。該方法有ra.fisher首先提出,後來由gw.snedecor完善,為了紀念fisher,故稱方差分析為f檢驗。組間均方 ms組間 ss組間 v組間,ss代表離均差平方和,v代表自由度,組間變異包括處理效應和隨機誤差。組內均方 ms組內 ss組內 v...

單因素方差分析(ANOVA)的多重比較校正

如果anova結果顯示至少有兩組的均值不相等,那麼接下來要確定是哪兩組或哪些組的均值不相等,對差異的這個結果進行後續檢驗就叫做post hoc test,又叫做multiple comparison anlaysis test。1,the tukey method 優點是對所有組進行兩兩比較,計算簡...

雙因素方差分析 多因素方差分析

在前面我們講過簡單的單因素方差分析,這一篇我們講講雙因素方差分析以及多因素方差分析,雙因素方差分析是最簡單的多因素方差分析。單因素分析就是只考慮乙個因素會對要比較的均值產生影響,而多因素分析是有多個因素會對均值產生影響。需要注意的是乙個因素可能會有不同的水平值,即不同的取值。比如要判斷某一款藥對某種...