可汗學院統計學 task 3

2021-09-26 00:05:06 字數 927 閱讀 4696

假設檢驗(hypothesis testing):依據一定的假設條件由樣本推斷總體的一種方法。

基本思想是小概率反證法思想。

小概率思想是指小概率事件(p<0.01或p<0.05)在一次試驗中基本上不會發生。

反證法思想是先提出假設(檢驗假設h0),再用適當的統計方法確定假設成立的可能性大小,如可能性小,則認為假設不成立,若可能性大,則還不能認為假設不成立。

假設檢驗分假設和檢驗兩步,先提出假設,之後再來驗證假設是不是合理的。

為了完成假設檢驗,需要定義乙個概念:p值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為有統計學差異, p<0.01 為有顯著統計學差異,p<0.001為有極其顯著的統計學差異。

比如我們要猜1000次用二項分布來計算很麻煩,根據中心極限定理,我們知道,可以用正態分佈來近似。但是,對於正態分佈,沒有辦法算單點的概率(連續分布單點概率為0),只能取乙個區間來算極限,所以就取極端的點組成的區間。

取單側還是雙側,取決於應用,什麼叫做更極端的點,也取決於應用。

單側檢驗指按分布的一側計算顯著性水平概率的檢驗。用於檢驗大於、小於、高於、低於、優於、劣於等有確定性大小關係的假設檢驗問題。這類問題的確定是有一定的理論依據的。假設檢驗寫作:μ1<μ2或μ1>μ2。

雙側檢驗指按分布兩端計算顯著性水平概率的檢驗, 應用於理論上不能確定兩個總體乙個一定比另乙個大或小的假設檢驗。一般假設檢驗寫作h1:μ1≠μ2

z檢驗(z test)是一般用於大樣本(即樣本容量大於30)平均值差異性檢驗的方法。它是用標準正態分佈的理論來推斷差異發生的概率,從而比較兩個平均數的差異是否顯著。

t檢驗,亦稱student t檢驗(student』s t test),主要用於樣本含量較小(例如n < 30),總體標準差σ未知的正態分佈。 [1] t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。

可汗學院統計學Task2

中心極限定理 設從均值為 方差為 2的任意乙個總體中抽取n個樣本,隨著樣本容量增大或趨近於無窮,樣本均值的抽樣分布近似服從均值為 方差為 2 n的正態分佈,隨著樣本容量n變大,抽樣分布標準差越小,越收攏。該定理良好的定義了均值和方差的分布 通過對原分布就是抽樣得到樣本均值的分布,無論原分布如何,抽樣...

可汗學院的統計學

描述性統計學 描述集中趨勢,均值,中位數,眾數,離群值,在平均工資,平均房價,學生成績等情況中,中位數或者眾數更能反映集中趨勢,離群值可能有 量錯誤或沒寫特殊條件的值沒有參考意義,但是會改變平均值 連續型隨機變數 離散型隨機變數 離散概率密度分布函式,條形圖 連續概率密度分布,因為是連續的,可以去無...

可汗學院統計學筆記(二)

中心極限定理 假設我們有乙個分布,它有定義好的均值和方差。用x表示服從這個分布的變數。進行n次實驗 n很大 每次實驗得到的結果是對這個分布的抽樣,將每次實驗結果用 這裡有乙個重要的分布 也就是 上提供了乙個演示程式可以讓我們更好地理解中心極限定理。第一行是原始分布,它可以是任意乙個奇怪的分布。第二行...