求均值方差 方差分析異方差怎麼辦?

2021-10-14 16:46:14 字數 1414 閱讀 8202

方差分析不管你是單因素還是多因素,當各組的樣本量都相等時,我們通常會忽略「方差齊性」這個假設,也就是方差不齊也是可以的。比如單因素方差分析你有3個組,每組的樣本容量都是20,則即使方差不齊也可以當成是方差齊進行f檢驗。雙因素「性別」和「教育程度(高中,本科,研究生)方差分析,如果男高中,男本科,男研究生,女高中,女本科,女研究生這6個組的樣本容量一樣,則即使方差不齊也可以當成是方差齊進行f檢驗。另外即使各組樣本量和樣本方差都有略微差別,我們也大可不必擔心。一般來說,如果沒有哪個樣本的方差是其它樣本方差4 倍以上(也就是說沒有樣本的標準差是其它樣本的兩倍以上),並且沒有哪個樣本的樣本量是其它樣本量的1.5 倍以上時, 你就可以用一般的方差分析程式以及使用略有一點誤差的臨界f 值表。如果樣本量相差很大(井且樣本量本身不是很大)並且樣本的方差也很不相同,那麼我們就有理由擔心方差不齊的問題。總結來說就是當各組樣本量都相等時,方差分析對於方差不齊是穩健的。

方差不齊,另乙個辦法是對資料進行變換,變換後也許方差齊。變換要注意一點的是有些變換是可以的,有些變換是不可以的。比如 對數變換,開根號變換都是可以的,為何?因為這兩種變換不會改變量值的大小比較。30>20,必定有 ln30>ln20,30的平方根》20的平方根,變換前後不改變量值大小排序。但是「標準化」變換是不可以的,標準化後均值都為零,也就是變換後的均值都相等,這就改變了原始變數均值的大小排序。

方差分析可以使用回歸方法,方差不齊對回歸係數的影響主要是回歸係數的標準誤估計不準確,在大樣本情況下,我們可以得到 「懷特異方差-穩健標準誤」,基於這個「穩健標準誤」我們就能對回歸係數做正確的假設檢驗,也就是我們解決了異方差導致的問題。這個方法的缺點就是要求大樣本。

我個人比較推薦的是「自助法(bootstrap method)。自助法可以得到自助法回歸係數,這個回歸係數非常穩健,不管你有沒有異方差都可以使用,當然,如果有異方差,這個自助法就顯得更有威力了。spss 的 glm 模組可以得到自助法回歸係數。spss中多重比較也可以使用自助法。

下面再說說單因素方差分析的額外方法。方差分析你可以做f檢驗,也可以直接進行多重比較。也就是方差分析並不是一定要做f檢驗。如果檢測到方差不齊,可以使用方差不齊的「多重比較方法」,比如 games-howell pairwise comparison test (gh) ,tamhane』s t2 ,dunnett』s t3 和 dunnett』s c 就是方差不齊的多重比較方法。至於f檢驗,也有兩種方差不齊的f檢驗方法:brown-forsythe 和 welch 就是單因素方差分析方差不齊的f檢驗法。

單因素方差分析還有乙個非引數檢驗方法叫:kruskal-wallis檢驗法。這個方法不要求正態,也不要求你方差齊。

自助法的優點是對於各種苛刻條件它都很穩健,而其它的方法只在某些方面是穩健的,也就是其它方法不能面對各種條件都穩健。

自助法和資料變換這兩個方法,我認為都很好,並駕齊驅。如果通過資料變換能讓方差齊,那麼這兩個方法你可以都使用,然後看看它們之間的差異,也許能給你帶來其它更深層次的思考。

雙因素方差分析 兩因素方差分析怎麼理解?

看完單因素方差分析,一般的統計學教課書中並不會直接講two way 雙因素 方差分析,而是講 隨機區組設計的方差分析 那這兩者有什麼關係嗎?從統計方法的角度來看,隨機區組設計的方差分析其實就屬於兩因素 或多因素 方差分析,一種說法認為,為什麼不直接叫兩因素,是因為不把 區組因素 算作一類真正的 因素...

雙因素方差分析 多因素方差分析

在前面我們講過簡單的單因素方差分析,這一篇我們講講雙因素方差分析以及多因素方差分析,雙因素方差分析是最簡單的多因素方差分析。單因素分析就是只考慮乙個因素會對要比較的均值產生影響,而多因素分析是有多個因素會對均值產生影響。需要注意的是乙個因素可能會有不同的水平值,即不同的取值。比如要判斷某一款藥對某種...

python方差分析

目錄 一元方差分析 一元單因素方差分析 一元多因素方差分析 協方差分析 場景 5種不同畫素的數位相機 單因素 對銷量 研究的因變數 是否有顯著差異 g dc sales pixel unique args for i in list g 將pixel變數轉化為分類變數並為其值掛標籤 dc sales...