1 假設檢驗

2021-08-03 17:53:39 字數 2425 閱讀 3491

翻譯 + 匯集 方便自己檢視用 

參考:參考:

一. 假設檢驗邏輯

假設指的是關於總體的普遍性論斷,檢驗指的是看從樣本得出的結論能否推論到總體。

假設檢驗的邏輯基於科學哲學的乙個重要論點:全稱命題只能被否證而不能被證明。其道理很簡單:個案不足以證明乙個全稱命題,但可以否定全稱命題。

研究時,我們為了自己的研究假設不被否認,所以我們就搞個和研究假設相反的虛無假設。如果我們否證了虛無假設,就相當於我們證明了研究假設。所以假設檢驗就是要試圖否證虛無假設,或者說拒絕虛無假設。這是第1層道理。

第2層道理和抽樣分布有關。由於抽樣的原因,樣本並不可能絕對地否證虛無假設。但在統計中,小概率事件可以等同於不可能發生的事件。我們在這個意義上去在一定的事先約定的概率水平上去拒絕虛無假設。

二. 舉個栗子

我說我射擊特別厲害,平均能打到 8 環,那麼如何驗證我是不是在吹牛呢,那就讓我做幾次射擊看看我水平到底怎麼樣。

首先你選擇相信我,假設我沒吹牛,我的成績在8環附近(這就是原假設)。那麼,我作為乙個8環水平的選手,射中的環數應該服從乙個平均值為 8 的高斯分布。

但是事先說好我的原則:

1、可能我當天沒吃飽飯呀、或者心情不好呀,而且也就只讓我射擊幾次,我可能發揮不好等等的,所以你不能輕易懷疑我,如果我打 7 環、 6 環甚至 4 環你也不能懷疑我在吹牛;

2、但是畢竟作為乙個 8 環水平的選手,基本功還應該是在的,如果我只打出了 2 環,你就會懷疑我是不是在吹牛了。因為,作為乙個 8 環水平的選手,打出 2 環可是概率極低的事情;

那麼根據這個規則我們設定乙個閾值比如 3.6 環(這個閾值就是臨界值),如果我的成績為 2 環(我的成績是觀察值),那我就是在吹牛。注意作為乙個 8 環選手,打出小於這個閾值的概率是極低的(這個概率就是顯著性水平)。

還有一種判斷我是不是在吹牛的方法是,我已經打完了,計算打出小於我這個成績的概率(這個概率是p 值),如果這個概率小於顯著性水平,則說明我的成績小於於臨界值,則說明我在吹牛;反之則我沒吹牛。(這個部分結合下面那個圖來理解)

用統計的說法就是:

1、不輕易拒絕原假設。原假設即使真的成立,而觀察的樣本由於數量較少,觀察值存在一定的波動。所以我們要給原假設一定範圍的容忍度,這個容忍度要盡可能大,觀察值出現在這個範圍內都是可以容忍的。

2、小概率事件發生不正常。如果小概率事件還是發生了,那麼就說明原假設有問題。

結合這兩點,我們設定乙個隨機變數的區域,這個區域是偏離原假設的,並且發生在這個區域的概率很小,如果實際觀察到的值還是出現在這個不太可能出現的範圍內,那麼我們可以拒絕原假設。

兩種決定是否接受原假設的方法:

1、給定發生偏離原假設極端情況的概率(這就是顯著性水平alpha)。可以計算得到對應的臨界值( 參照圖1,偏離原假設的陰影部分面積表示顯著性水平,對應的座標表示臨界值)。若觀察值在臨界值範圍內,表示出現這種現象都是比較正常的,則可接受原假設;若觀察值超出臨界值範圍,則表示在原假設條件下出現了不太可能的現象,那麼我們就懷疑原假設的成立性,則拒絕原假設 。

2、給定發生偏離原假設極端情況的概率(這就是顯著性水平alpha)。計算出現觀察值及比觀察值還要偏離原假設的概率(這就是 p 值)。(參照下面這個圖來理解)若p > alpha,則表示觀察值在臨界值範圍內,則可接受原假設(如圖1);若 p < alpha,則表示觀察值在臨界值範圍之外,則拒絕原假設(如圖2)。p值是乙個人工定義的東西,它其實還是通過判斷觀察值是否在臨界值範圍內來決定是否接受原假設。

總結下:

對於乙個假設,我不知道它是否成立,而且實際測試過程中也存在許多非確定性因素可能導致我的測試過程不準確,那麼我給出乙個出現錯誤的容忍度(也就是顯著性水平alpha),根據這個容忍度可以得到相應臨界值(若觀察值在這個範圍內都是正常的,否則不正常),然後將觀察值和這個值比較。

但是有些情況下觀察值不太好看出來,我們可以計算出發生觀察情況以及更壞情況的值(也就是p值)。若p值比alpha值大,則表明觀察值在臨界值範圍內,可接受原假設(如圖1);若p值比alpha值小,則表明觀察值在臨界值範圍外,則決絕原假設(如圖2)。

假設檢驗 假設檢驗學習筆記

在實際工作和研究中,往往只能獲得資料的一部分,通常指這個資料為樣本,而通過樣本對整體的估計被稱為假設檢驗。樣本是從整體中選取的較小集合,中心極限定律 樣本的均值約等於總體的均值 不管整體什麼分布,任意乙個總體的樣本均值都會圍繞在總體的均值周圍,且呈正太分布。關鍵資訊 樣本的均值等於總體的均值 樣本的...

假設檢驗 到底該怎麼理解假設檢驗?

學過統計學或概率論的同學,對 假設檢驗 這個詞一定不陌生。因為期末考試的卷子裡必定會考一道這種題,那個時候,我其實對假設檢驗的流程並不是很理解,不過幸好流程簡單,照葫蘆畫瓢,套一套格式就能答對。那假設檢驗到底是個什麼東西?先上一道假設檢驗的例題,回憶一下假設檢驗的流程,找一下當初的感覺。某工具機廠加...

(六)假設檢驗

假設檢驗的步驟 步驟1 提出原假設與備擇假設 步驟2 指定檢驗中的顯著性水平 步驟3 蒐集樣本資料並計算檢驗統計量的值 p 值方法 步驟4 利用檢驗統計量的值計算p 值 步驟5 如果p 值 a,則拒絕h0 臨界值方法 步驟6 顯著性水平確定臨界值以及拒絕規則 步驟7 利用檢驗統計量的值以及拒絕規則確...