可汗學院統計學 task 3

假設檢驗(hypothesis testing)：依據一定的假設條件由樣本推斷總體的一種方法。

基本思想是小概率反證法思想。

小概率思想是指小概率事件（p<0.01或p<0.05）在一次試驗中基本上不會發生。

反證法思想是先提出假設(檢驗假設h0)，再用適當的統計方法確定假設成立的可能性大小，如可能性小，則認為假設不成立，若可能性大，則還不能認為假設不成立。

假設檢驗分假設和檢驗兩步，先提出假設，之後再來驗證假設是不是合理的。

為了完成假設檢驗，需要定義乙個概念：p值即概率，反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的p 值，一般以p < 0.05 為有統計學差異， p<0.01 為有顯著統計學差異，p<0.001為有極其顯著的統計學差異。

比如我們要猜1000次用二項分布來計算很麻煩，根據中心極限定理，我們知道，可以用正態分佈來近似。但是，對於正態分佈，沒有辦法算單點的概率（連續分布單點概率為0），只能取乙個區間來算極限，所以就取極端的點組成的區間。

取單側還是雙側，取決於應用，什麼叫做更極端的點，也取決於應用。

單側檢驗指按分布的一側計算顯著性水平概率的檢驗。用於檢驗大於、小於、高於、低於、優於、劣於等有確定性大小關係的假設檢驗問題。這類問題的確定是有一定的理論依據的。假設檢驗寫作：μ1<μ2或μ1>μ2。

雙側檢驗指按分布兩端計算顯著性水平概率的檢驗，應用於理論上不能確定兩個總體乙個一定比另乙個大或小的假設檢驗。一般假設檢驗寫作h1：μ1≠μ2

z檢驗（z test）是一般用於大樣本（即樣本容量大於30）平均值差異性檢驗的方法。它是用標準正態分佈的理論來推斷差異發生的概率，從而比較兩個平均數的差異是否顯著。

t檢驗，亦稱student t檢驗（student』s t test），主要用於樣本含量較小（例如n < 30），總體標準差σ未知的正態分佈。 [1] t檢驗是用t分布理論來推論差異發生的概率，從而比較兩個平均數的差異是否顯著。