四假設檢驗

假設：對總體引數的具體數值所做的陳述。

假設檢驗：先對總體引數提出某種假設，然後利用樣本資訊判斷假設是否成立的過程。

零假設：通常將研究者想收集證據予以反對的假設稱為原假設（零假設）用h0表示。

備擇假設：通常將研究者想收集證據予以支援的假設稱為備擇假設（研究假設）用h1表示。

eg:一種零件的標準是直徑10cm,對生產過程進行控制，確定這台工具機生產是否的零件是否符合標準要求。進行調整，陳述用檢驗生產過程是否正常的原假設和備擇假設？

h0:μ=10（生產過程正常）反對

h1:μ≠10（生產過程不正常）支援

建立假設的幾點認識：

①原假設和備擇假設必有乙個成立，而且只有乙個成立；

②通常先確定備擇假設，再確定零假設，因為備擇假設是我們關心的；

③在假設檢驗中，等號總是放在原假設上，為數學表述上的方便，我們將與h1對立的所有可能情況放進了只含乙個符號的原假設之中；

④具有方向性的假設稱為單側假設（單尾檢驗），沒有方向性，假設稱為雙側假設（雙尾假設）；

單側假設（單尾假設）：備擇假設具有特定的方向性，並含有符號『>』或『

雙側檢驗（雙尾檢驗）：備擇假設沒有特定的方向性，並含有符號『≠』的假設檢驗。

假設檢驗的基本形式：

假設雙側檢驗

單側檢驗

左側檢驗

右側檢驗

原假設h0：μ=μ0

h0：μ≥μ0

h0：μ≤μ0

備擇假設

h1：μ≠μ0

h1：μ

h1：μ>μ0

假設檢驗的目的是根據樣本資訊做出決策，也就是作出吃否拒絕原假設而傾向於備擇假設的決策。因為原假設和備擇假設不能同時成立。

第i類錯誤（棄真假設）：當原假設為真時，拒絕原假設【α】。

第ii類錯誤（取偽假設）：當原假設為假時沒有拒絕原假設【β】。

決策結果

實際情況

h0為真

h0為假

未拒絕h0

正確決策

第ii類錯誤β

拒絕h0

第i類錯誤α

正確決策

注意：只有原假設被拒絕時，才會犯第i類錯誤；當原假設未被拒絕時，會犯第ii類錯誤。由於犯第i類錯誤的概率是由研究者控制的，因此在假設檢驗中，往往控制第i類錯誤的發生概率。發生第i類錯誤的概率也常被用於檢驗結論的可靠性，並將這一概率稱為顯著性水平。

顯著性水平：假設檢驗中犯的第i類錯誤的概率。【α】

顯著性水平是事先指定的犯第i類錯誤的概率α的最大允許值。犯第i類錯誤的後果更嚴重，因此α會取值比較小。通常選擇顯著性水平為0.05或比0.05更小的概率。通常α=0.01、α=0.05、α=0.1等。

在確定顯著性水平α就等於控制了第i類錯誤的概率，但是第ii類錯誤的概率β不確定。因此，在假設檢驗中我們採用「不拒絕h0」,避免第ii類錯誤的發生風險。

提出具體假設後，研究者需要提供可靠的證據來支援所提出的備擇假設。資訊主要來自所取得樣本，檢驗統計量便於對樣本資訊進行壓縮和概括。

檢驗統計量：根據樣本觀測結果計算得到的，並據以對原假設和備擇假設作出決策的某個樣本統計量。

檢驗統計量實際是總體引數的點估計量（樣本均值就是總體均值的乙個點估計量），將點估計量標準化後，才能用與度量它與原假設的引數值之間的差異程度，對點估計量標準化的依據是：①原假設為h0為真②點估計量的抽樣分布。標準化檢驗統計量簡稱為檢驗統計量。

標準化的檢驗統計量可表示：

標準化的檢驗統計量=點估計量—假設值/點估計量的抽樣標準差

拒絕域：能夠拒絕原假設的檢驗統計量的所有可能取值的集合。

拒絕域就是顯著性水平α所圍成的區域。樣本觀測結果數值落在拒絕域內，就拒絕原假設。拒絕域的大小與選定的顯著水平有一定關係，確定顯著性水平α後，根據α確定拒絕域的具體邊界值，拒絕與的邊界值稱為臨界值。

臨界值：根據給定的顯著性水平確定的拒絕與的邊界值。

根據給定的α，得到臨界值。將檢驗統計量的值與臨界值進行比較，作出是否拒絕原假設的決策。當樣本固定，拒絕域的未知則取決於檢驗是單側檢驗還是雙側檢驗。雙側檢驗的拒絕域在抽樣分布的兩側；備擇假設具有符號『』，則拒絕域位於抽樣分布的右側，稱右側檢驗。在給定顯著性水平α條件下，拒絕域與臨界值如下圖：

顯著性水平α是在檢驗之前確定的，也就是確定了拒絕域，不論檢驗統計量的值是大小，如果落在拒絕域就拒絕原假設h0，由於α是犯第i類錯誤的上線控制值，只是個可靠性的大致範圍，無法給出精確度量。要測量出樣本觀測資料與原假設中假設的值μ0的偏離程度，則需要計算p值。

p值（觀察到的顯著性水平）：在原假設為真的條件下，檢驗統計量的觀察值大於或等於其值的概率。

p值反應時間觀測到的資料與原假設h0之間不一致程度的乙個概率值。p值越小，說明實際觀測到的資料與h0之間不一致的程度越大，檢驗的結果也就越顯著。

p值是當原假設正確時，得到的所觀測資料的概率。

p值進行決策方法簡單，與α進行比較，可判斷是否拒絕原假設。不論是單雙檢測，用p值進行決策的準則都是：p值

利用統計量根據顯著性水平作出決策，如果我們拒絕原假設，也僅僅是知道犯錯誤的可能性是α那麼大，而p值則是犯錯誤的實際概率。

假設檢驗的重要一步是確定適當的檢驗統計量，大樣本情況下，樣本均值的抽樣分布近似服從正態分佈，抽樣標準差是σ/√n。

eg:一種飲料，每罐的容量是255ml，標準差為5ml,為檢驗每罐容量是否符合要求，質檢人員隨機抽取40罐進行檢測，測得每罐的平均容量為255.8ml。取顯著性水平α=0.05，檢驗是否符合標準。

h0：μ=255

h1：μ≠255

計算檢驗統計量的具體數值：

z=(255.8-255)/5√40=1.01

檢驗統計量的含義：樣本均值與檢驗的總體均值相比，相差1.01個抽樣標準差。

雙側檢驗取值： zα/2 單側檢驗取值： zα

α=0.05 zα/2=z0.025=1.96.由於|z|=1.01用p值檢驗

excel norm.s.dist 函式，將z的絕對值1.01錄入，得到結果0.844，

雙側檢驗p值：2（1-p值）單側檢驗p值：1-p值*

z=1.01 雙側檢驗最後的p值為：p=2*(1-0.844)=0.312 > α=0.05 不拒絕h0,檢驗結果表明:沒有證據表明生產的飲料不符合標準要求。

檢測與大樣本總體均值檢測一樣，區分大樣本，小樣本，是因為大樣本的統計量用正態分佈，小樣本用t分布。

總結：兩種情形：①大樣本條件下，總體均值的檢驗採用正態分佈統計量，②小樣本，總體均值的檢驗採用t分布統計量。不論是總體均值的檢驗還是比例檢驗，除了利用計算檢驗外，可之間用p值進行檢驗。

四假設檢驗

假設檢驗假設檢驗學習筆記

假設檢驗到底該怎麼理解假設檢驗？

（六）假設檢驗

四 假設檢驗

假設檢驗 假設檢驗學習筆記

假設檢驗 到底該怎麼理解假設檢驗？

（六）假設檢驗

相關推薦

四假設檢驗

假設檢驗假設檢驗學習筆記

假設檢驗到底該怎麼理解假設檢驗？