資料的統計量 方差

2021-07-26 01:13:59 字數 681 閱讀 4615

上一節我們聊過 四分位數,其實還有十分位數,都是一樣的計算方法。他們都是獲取資料的分散性。

通過箱線圖來體現。

但有的時候,我們可能會對資料要求更高,希望 獲取其中的變異性,如工資變化差異到底多大,屌絲公司基本都是1.5-3k,土豪公司可能1w,5w,8w各種都有。

那麼如果知道公司的工資是有很多檔位呢?

方法:每個數值和均值的距離!這樣就知道資料的變異情況

平均距離 = ((1-μ)+(2-μ)+...+(n-μ))/n = 0

現在咋辦?結果是0

要想辦法解決這個抵消的問題,我們這樣試一下:

平均距離² =  ((1-μ)²+(2-μ)²+...+(n-μ)²)/n 這樣不會抵消了。都是正數!!

它就是大名鼎鼎的 「方差」,它是度量資料分散性的一種方法,數值和均值距離的平方數的平方值!

方差= σ(x-μ)²/n

但是,有人覺得不可理解,為什麼要弄個平方,感覺很奇怪呢。 ok

——————

那我在方差上開個根號,得到的值。我們叫

標準差,它也有專用符號σ (西格瑪的小寫),度量數值和均值的距離!

σ² = 方差

計算公式:

σ² = σx²/n  - μ²

t統計量和z統計量

z統計和t統計可以用來檢驗兩個平均數之間差異顯著的程度,z適合大樣本的情況 樣本數大於30 t適合小樣本的情況。z檢驗的步驟 h0 1 第二步 計算統計量z值,對於不同型別的問題選用不同的統計量計算方法,1 如果檢驗乙個樣本平均數 的差異是否顯著。其z值計算公式為 其中 2 如果檢驗來自兩個的兩組樣...

常見統計量

最小值.數值變數的最小值。最大值.數值變數的最大值。總數.所有具有缺失值的測量值的總和或合計。範圍.數值變數的最大值與最小值的差值就是用最大值減最小值後得出的值。平均值.集中趨勢的測量。算術平均值,等於總和除以觀測值數。均值標準誤.取自相同分布中隨樣本不同而變化的均值的值個數的度量值。用於粗略將觀測...

充分統計量

充分統計量不就是在統計量的前面加了乙個充分二字麼,首先它是乙個統計量,所謂的統計量本質就是樣本的函式,即給定一上具體的樣本,就會有乙個統計量這個函式值與之對應。每乙個函式都有特定的意義 統計量這個函式是為了從樣本中得到我們要得到的資訊,比如你可能想知道大家的平均水平,那求個平均值就好了,那麼在實際當...