檢驗樣本資料是否服從某一分布(Python3)

2021-08-20 00:18:27 字數 852 閱讀 6167

1.夏皮羅維爾克檢驗(shapiro-wilk test)

檢驗小樣本資料是否服從正態分佈

2.科爾莫戈羅夫檢驗(kolmogorov-smirnov test)

1)用於檢驗x的分布g(x)是否服從給定分布f(x),僅適用於連續分布的檢驗;

2)檢驗兩組資料是否來自統一分布。

3.安德森-達令檢驗(anderson-darling test)

檢驗樣本資料是否來自特定分布,包括分布:'norm', 'expon', 'gumbel', 'extreme1' or 'logistic'. 

4.lilliefors檢驗

檢驗樣本資料是否來自正態總體

5.基於偏度和峰度的檢驗,可用於檢驗樣本資料是否來自正態分佈(偏度=0,峰度=3),易受異常值影響,不能用於小樣本。

偏度檢驗:h0 : 樣本資料的偏度=0   h1

:樣本資料的偏度≠0

拒絕原假設則認為樣本資料不是來自正態總體,但不拒絕原假設不能說明樣本資料來自正態總體,只能說明資料對稱,只有在    確定對稱性是影響分布的形態的唯一因素時,偏度檢驗才適用。

峰度檢驗:h0 : 樣本資料的峰度=3   h1

:樣本資料的峰度≠3

拒絕原假設則認為樣本資料不是來自正態總體,但不拒絕原假設不能說明樣本資料來自正態總體,容易出錯不推薦使用。

雅克-貝拉檢驗(jarque-bera test):檢驗樣本是否來自正態分佈

檢驗資料集是否服從正態分佈

1.p p圖 以樣本的累積頻率作為橫座標,以正太分布計算的響應累積概率作為縱座標,把樣本值表現為執教座標系中的散點。若資料集服從正太分布,則樣本點應圍繞第一象限的對角線分布。1.2 qq圖 以樣本的分位數作為橫座標,以按照正太分布計算的相應分位點作為縱座標,把樣本表現為直角座標系的散點。若服從正太分...

機器學習樣本資料集,訓練正負樣本

1 caltech 101 資料庫 該資料庫在2003年被發布,包括101類目標影象和1類背景影象,共102類,彩色影象較多,有部分灰度影象。總共影象數為9145 除去背景後總數為8677 每類影象數大約在31 800之間,影象大小為300 200。此資料庫的特點是 每個影象只含有乙個目標,且目標大...

小樣本資料集介紹

本篇對小樣本學習常用資料集進行介紹,由於本人理解問題,可能還存在誤差。1 omniglot 相當於1623個類,每類20個樣本。對於one shot來說,support num per class 1,query num per class 19。每個影象都與筆畫資料配對,座標序列為 x,y,t x...