多重比較的問題

在統計學中，當同時考慮一系列的統計推斷或者基於觀察值選擇的引數的子集時會發生多重比較的問題（multiple comparisons problem）。

原因：當乙個人把子集作為整體的估計時，錯誤的推斷很可能發生，包括置信區間沒有包含相應的總體引數或者是假設檢驗錯誤地拒絕了零假設。對此，我舉出兩個例子作為說明。

①假設我們想要去判斷乙個寫作教學的新方法與傳統方法的好壞。那麼我們把學生分為兩組，一組使用新方法（**組），一組使用傳統方法（對照組）。我們可以根據學生們的語法、拼寫、內容等來評估這兩組的表現，但是隨著評估引數的增多，由於隨機因素，這兩組會至少在乙個引數上表現得不同，那麼此時我們怎麼判斷這種不同時隨機的表現還是使用方法所致的呢？

②經典的拋硬幣的問題：乙個均勻的硬幣（即正反兩面概率相等）拋10次至少有9次正面的概率是（10+1）*0.5^10 =0.0107, 這個概率低於0.05,所以我們一般可以推定一次拋硬幣的實驗中這種情況是不會發生的，反之，如果一次實驗中發生了這種小概率的事件，可以宣稱這個硬幣是不均勻的。現在，假設我們有100個均勻的硬幣，把它們同時做上訴的實驗，不會發生乙個硬幣拋10次至少9次正面的概率是（1-0.0107）^100=0.34。由此，我們很可能錯誤地推斷至少有乙個硬幣是不均勻的。所以單個硬幣的評判標準對多個硬幣是不適用的。

解決方法：為了解決上訴的問題，可以使用錯誤發現率（fdr:false discovery rate）、bonferroni correction等方法。

注：通過維基百科歸納整理

多重比較的問題

多重比較和多重比較陷阱

notes spm多重比較校正

t檢驗orF檢驗and多重比較

多重比較的問題

多重比較和多重比較陷阱

notes spm多重比較校正

t檢驗orF檢驗and多重比較

相關推薦