DataWhale 統計學一周訓練營 task3

2021-09-11 18:57:33 字數 681 閱讀 9547

第一型錯誤

在假設檢驗中,接受或者拒絕h0,都有概率犯錯誤。第一類錯誤就是原假設為真,而檢驗的結論卻勸你放棄原假設,稱為棄真錯誤。如果原假設不是真,而檢驗的結論卻勸你接受原假設稱為取偽錯誤。

顯著性水平:當作為乙個等式的原假設為真時,犯第一類錯誤的概率稱為檢驗的顯著性水平,用α表示,一般取0.05 和0.01。​​​顯著水平與置信水平和為1.​

在假設檢驗的大多數應用中,雖然對第一類錯誤的概率進行了控制,但通常並不對發生第二類錯誤的概率加以控制。因此,如果我們決定接受假設h0,我們並不能確定該決策有多大可信度。由於顯著性檢驗中第二類錯誤的發生具有不確定性,所以統計學家通常建議我們在敘述中採用「不能拒絕h0」而不採用「接受h0」這種說法。這種情形下,只能得出兩種可能的結論:不能拒絕h0或拒絕h0.​

重要引數檢驗

雙側檢驗

σ未知情形

必須利用樣本同時估計σ和μ,利用樣本均值估計μ,用樣本標準差估計μ。

在σ已知清醒下,檢驗統計量的抽樣分布是標準正態分佈,然而在​σ未知情形下的檢驗統計量的抽樣分布是t分布。由於根據樣本對μ和σ同時進行估計,t分布的變異性更強。

總體比率

基於樣本比率與總體比率的假設值之差來進行。假設檢驗所使用的方法與對總體均值進行假設檢驗時所使用的方法相似,唯一的不同之處是我們利用樣本比率和標準誤差來計算檢驗統計量。然後利用p-值法或者臨界值法確定是否拒絕原假設。

DataWhale 統計學一周訓練營 task1

參考 學習內容 一 可汗學院統計學12 26集,統計學基礎知識 二項分布及泊松分布 學習內容 二 可汗學院統計學27 34集,大數定理 正態分佈 其他資料 深入淺出統計學 商務與經濟統計 二項分布 泊松分布 泊松分布由二項分布推導而來。泊松過程 把單位時間分為無限份,每乙份的概率為 隨機變數x符合二...

統計學基本知識 datawhale 任務一,二

按照網易雲課堂可汗學院統計學進度,從第1課 34課 條形圖線型圖 餅圖箱線圖 莖葉圖各種作用就不一一闡述了,比較基礎。總體和樣本 總體是統計學解決任何乙個問題都有待認識客觀事物的全體,稱作統計總體。總體單位是組成總體的各個個體。樣本則是為了認識總體而從總體中選取的實際觀測的個體和。二項分布 設在n重...

統計學基本知識 datawhale 任務三

假設檢驗是數理統計中根據一定假設條件由樣本推斷總體的一種方法,依據的原理是小概率事件原理,即小概率事件在一次試驗中是幾乎不可能發生的。建立假設 原假設與備擇假設 原假設記作h 0h 0 h0 是指待檢驗的假設,一般為研究者想要收集證據反對的,沒有充分理由否定的假設。備擇假設記作h 1h 1 h1 是...