什麼是假設檢驗?

2021-10-11 04:36:08 字數 2285 閱讀 1751

目錄

假設檢驗原理

置信區間

反證法小概率思想

假設檢驗步驟

假設檢驗的意義

在引數估計的區間估計中,我們提到置信區間的概念,有提到置信區間最主要的應用是用於假設檢驗。(詳情請見☞什麼是引數估計)

那什麼是假設檢驗?

假設檢驗(test of bypothesis)是統計推斷的乙個重要內容,用於判斷某個假設是否正確。在資料分析中,總體的引數始終是不可知的,只能由統計量推斷總體的引數。在統計推斷過程中,需要對引數提出一定的假設,然後對提出的假設進行假設檢驗。 假設檢驗與引數估計(包括點估計和區間估計)是建立在中心極限定理和抽樣分布之上的推斷統 計的兩個重要基礎方法,由這兩個方法出發,生發出諸多有針對性的統計分析方法。

假設檢驗涉及的範圍非常廣泛,幾乎我們用到的所有統計分析方法都要用到它,如是否相關、 是否服從正態分佈、兩個總體均值是否相等、回歸係數是否顯著、過程是否穩定等等均運用了 假設檢驗。

假設檢驗的原理:假設檢驗 = 顯著性水平 + 小概率思想 + 反證法

假設檢驗中引入了顯著性水平的概念,要理解顯著性水平α,就要複習下什麼是置信區間了。

區間估計(interval estimation)是從點估計值和抽樣標準誤出發,按給定的概率值建立包含待估計引數的區間。其中這個給定的概率值稱為置信度或置信水平(confidence level),這個建立起來的包含待估計引數的區間稱為置信區間(confidence interval),指總體引數值落在樣本統計值某一區內的概率。

什麼是顯著性水平?

所謂置信水平就是給出乙個區間的信心,這個信心以概率來表示,絕大多數情況下取 0.95,表示你對所估計的總體引數有95%的信心落在你所給的區間內。通常置信水平以1-α表 示,α稱為顯著性水平。

置信區間的建立就與中心極限定理和抽樣分布有關了,在給定置信度的條件下,置信區間的寬度決定於抽樣分布。 建立置信區間的意思是在設定的置信水平(如取0.95)下,總體引數落在這個區間的概率為 0.95,大致的理解是如果抽100次樣,建立100個置信區間,大約95個區間包含總體引數,約5個區間不包含總體引數(注意不是一定有5個,可能會多,也可能會少)。

劃定置信區間的兩個數值分別稱為置信下限(lower confidence limit,lcl)和置信上限(upper confidence limit,ucl)

什麼是反正法?

反證法(proof by contradiction),又稱為歸謬法、背理法。在證明數學問題時,先假定命題結論的反面成立,在這個前提下,若推出的結果與定義、公理、定理相矛盾,或與命題中的已知條件相矛盾,或與假定相矛盾,從而證明命題結論的反面不可能成立,由此斷定命題的結論成立。

例如證明

反證法思想:設定與原假設相反的假設h,如果h被推翻,則原假設成立。

第一步:我們假設

第二步:

故:q^2=2r^2,可知q也是偶數,這與p和q互質矛盾

第三步:得出結論,假設h被推翻,原假設成立。

什麼是小概率事件?

如何判斷抽樣結果是不是不合理呢?費希爾老先生提出了p值這個概念,用來表示在原假設成立的條件下,抽樣結果的不合理和更不合理的概率。他還給出了乙個判決點,即0.05,p值小於1/20就足以拒絕原假設了。

0.05是足夠小的概率,一般認為,在一次抽樣(試驗)中,小概率事件幾乎不可能發生,如果出現發生了,則說明事先的假設是錯誤的。但小概率事件並不是一定不會發生,當抽樣次數足夠多時,小概率事件是一定會發生的。這說明即使是一次抽樣,小概率事件仍有可能發生,也就是說存在判斷錯誤的可能性。

假設檢驗是抽樣推斷中的一項重要內容。它是根據原資料作出乙個總體指標是否等於某乙個數值,某一隨機變數是否服從某種概率分布的假設,然後利用樣本資料採用一定的統計方法計算出有關檢驗的統計量,依據一定的概率原則,以較小的風險來判斷估計數值與總體數值(或者估計分布與實際分布)是否存在顯著差異,是否應當接受原假設選擇的一種檢驗方法。用樣本指標估計總體指標,其結論有的完全可靠,有的只有不同程度的可靠性,需要進一步加以檢驗和證實。通過檢驗,對樣本指標與假設的總體指標之間是否存在差別作出判斷,是否接受原假設。 這裡必須明確,進行檢驗的目的不是懷疑樣本指標本身是否計算正確,而是為了分析樣本指標和總體指標之間是否存在顯著差異。從這個意義上,假設檢驗又稱為顯著性檢驗。

假設檢驗 假設檢驗學習筆記

在實際工作和研究中,往往只能獲得資料的一部分,通常指這個資料為樣本,而通過樣本對整體的估計被稱為假設檢驗。樣本是從整體中選取的較小集合,中心極限定律 樣本的均值約等於總體的均值 不管整體什麼分布,任意乙個總體的樣本均值都會圍繞在總體的均值周圍,且呈正太分布。關鍵資訊 樣本的均值等於總體的均值 樣本的...

假設檢驗 到底該怎麼理解假設檢驗?

學過統計學或概率論的同學,對 假設檢驗 這個詞一定不陌生。因為期末考試的卷子裡必定會考一道這種題,那個時候,我其實對假設檢驗的流程並不是很理解,不過幸好流程簡單,照葫蘆畫瓢,套一套格式就能答對。那假設檢驗到底是個什麼東西?先上一道假設檢驗的例題,回憶一下假設檢驗的流程,找一下當初的感覺。某工具機廠加...

(六)假設檢驗

假設檢驗的步驟 步驟1 提出原假設與備擇假設 步驟2 指定檢驗中的顯著性水平 步驟3 蒐集樣本資料並計算檢驗統計量的值 p 值方法 步驟4 利用檢驗統計量的值計算p 值 步驟5 如果p 值 a,則拒絕h0 臨界值方法 步驟6 顯著性水平確定臨界值以及拒絕規則 步驟7 利用檢驗統計量的值以及拒絕規則確...