假設檢驗 p value，FDR，q value

單個假設檢驗中主要依靠p值(或統計量t)做出是否拒絕零假設h0的決定：p-value和預先設定的檢驗水準 α 做對比，如果p-value小於等於α，拒絕原假設，否則不拒絕原假設。

在進行多重假設檢驗時，每個單獨的假設都具有其本身的i型錯誤。在這種情況下，如果不進行任何的控制，犯i-型錯誤的概率會隨著假設檢驗的個數而迅速增加。

多重假設檢驗中，廣泛使用的錯誤控制指標是總體錯誤率（family-wise error rate,fwer）,即至少出現一次錯誤地拒絕真實h0的可能性；fwer小於等於alpha。而研究者更關心的是能否盡量多地識別出差異表達的基因，並且能夠容忍和允許總的拒絕中發生少量的錯誤識別，稱為錯誤發現false discovery。即需要在錯誤發現和總的拒絕次數r之間尋找一種平衡，即在檢驗出盡可能多的候選變數的同時將錯誤發現率控制在乙個可以接受的範圍。

fdr錯誤控制法是benjamini於2023年提出一種方法,通過控制fdr(false discovery rate)來決定p值的域值. 假設你挑選了r個差異表達的基因，其中有s個是真正有差異表達的，另外有v個其實是沒有差異表達的，是假陽性的。實踐中希望錯誤比例q＝v/r平均而言不能超過某個預先設定的值（比如0.05），在統計學上，這也就等價於控制fdr不能超過5％.

對所有候選基因的p值進行從小到大排序，則若想控制fdr不能超過q，則只需找到最大的正整數i，使得 p(i)<= (i*q)/m.然後，挑選對應p(1),p(2),...,p(i)的基因做為差異表達基因，這樣就能從統計學上保證fdr不超過q。

因此，fdr的計算公式如下：

q-value(i)=p(i)*length(p)/rank(p)

假設檢驗 p value，FDR，q value

假設檢驗假設檢驗學習筆記

假設檢驗到底該怎麼理解假設檢驗？

（六）假設檢驗

假設檢驗 p value，FDR，q value

假設檢驗 假設檢驗學習筆記

假設檢驗 到底該怎麼理解假設檢驗？

（六）假設檢驗

相關推薦

假設檢驗假設檢驗學習筆記

假設檢驗到底該怎麼理解假設檢驗？