征服統計學10 什麼是95 置信區間?

2021-10-13 20:31:35 字數 1541 閱讀 7185

本文介紹置信區間 confidence interval,ci的自舉法計算及其意義。

自舉法計算置信區間

自舉法獲採樣本均值

計算置信區間

置信區間存在意義

作用一:同一組樣本劃定可以估計總體的區間

作用二:兩組樣本差異直接比較

置信區間(confidence interval,ci)比較容易理解的計算方法為自舉法(bootstrap)。

以估算一組雌鼠的體重為例快速熟悉下自舉法

為了估算一組雌性小鼠(很多很多只~~不可能每乙隻都稱量到)的體重,可通過計算12只雌性小鼠(上圖紅圈)樣本均值,利用自舉法確定乙個均值範圍以代表一組雌性老鼠的總體均值。

自舉法實現分三步如上圖:

經常聽到的95%置信區間(當然還有其它的置信區間,這裡以95%為例)就是覆蓋95%的均值(上文自舉法獲取的均值)的區間,上圖黑色劃線部分即是95%置信區間

上圖中每個紅色豎線是對所有雌鼠「真實」均值(真實被引住說明無法測量,只能通過抽樣推測)的估計,置信區間的作用一在於說明落在該區域的均值能夠用來對所有雌鼠「真實」均值進行估計。

95%的置信區間外的任何均值發生的概率都小於5%,是p值都小於0.05的小概率事件,與置信區間呈顯著差異,不能用來對所有雌鼠「真實」均值進行估計。

上圖雌雄性老鼠樣本的95%置信區間無重疊,在統計學上有顯著差異,只用根據雌雄鼠的置信區間有無重疊即可判定兩組鼠是否體重有差異。

但是,當兩組置信區間有部分重疊時,差異性需要借助t檢驗了。

統計學 置信區間

假設我們想直到1000個人的平均身高。但是對1000人分別進行身高測量太麻煩。所以我們選擇100人樣本進行估計。估計可以是點估計 估計確切身高數 也可以是區間估計 估計確切身高的範圍 區間估計更為科學,所以這裡我們選擇區間估計。要估計就要考慮估計的準確度,我們實現確定95 的估計準確度。95 準確度...

征服統計學02 什麼是正態分佈?

本文簡單介紹正態分佈 正態分佈簡介 正態分佈關鍵引數 均值 標準差 正態分佈曲線如何繪製 正態分佈曲線現象解釋 reference 正態分佈 normal distribution 又名高斯分布 gaussian distribution 又因其曲線酷似鐘形,得名鐘形曲線。還是以上篇提到的測量身高為...

統計學筆記1 置信區間

作為資料科學的重要基礎學科,我開始share統計學的學習筆記。單個正態總體,總體方差已知,均值的置信區間,基於中心極限定理 標準正態分佈,適用於樣本量大的情況 n 100 單個正態總體,總體方差未知,均值的置信區間,基於t分布,適用於樣本量較小的情況 bootstrap,通過數值模擬求置信區間 bo...