統計學常識筆記整理(二)

2021-09-25 22:13:12 字數 985 閱讀 3397

按照計量尺度不同,統計資料分為:分類資料、順序資料、數值型資料。

分類資料只能歸於某一類別的非數值型資料

異眾比率主要適合測度分類資料的離散程度,當然,對於順序的資料以及數值型資料也可以計算異眾比率。它雖然也是乙個反映離散程度的相對指標,但是與標準差係數不同。

異眾比率主要用於衡量眾數對一組資料的代表程度。異眾比率越大,說明非眾陣列的頻數佔總頻數的比重越大,眾數的代表性就越差;異眾比率越小,說明非眾陣列的頻數佔總頻數的比重越小,眾數的代表性越好。

其中, 表示異眾比率, 表示眾數次數,n表示總體單位總數(即總體次數)。

變異係數是衡量資料中各觀測值變異程度的另乙個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用標準差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能採用標準差,而需採用標準差與平均數的比值(相對值)來比較。標準差與平均數的比值稱為變異係數,記為c·v。變異係數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。

變異係數的計算公式為:變異係數 c·v =( 標準偏差 sd / 平均值mean )× 100%

在進行資料統計分析時,如果變異係數大於15%,則要考慮該資料可能不正常,應該剔除。

注意,變異係數的大小,同時受平均數和標準差兩個統計量的影響,因而在利用變異係數表示資料的變異程度時,最好將平均數和標準差也列出。

優點比起標準差來,變異係數的好處是不需要參照資料的平均值。變異係數是乙個無量綱量,因此在比較兩組量綱不同或均值不同的資料時,應該用變異係數而不是標準差來作為比較的參考。

缺陷當平均值接近於0的時候,微小的擾動也會對變異係數產生巨大影響,因此造成精確度不足。

變異係數無法發展出類似於均值的置信區間的工具。

統計學常識筆記整理(一)

統計學是指導統計活動的科學,也就是要為如何獲取資料 表現資料和分析資料提供理論方法。其研究物件為各種各樣客觀現象的數量方面。政治算術學派採用了數量分析方法 數理統計學派引入了大數法則 現代統計學時期出現了小樣本思想。國勢學派對統計學的主要貢獻是提出了 統計學 這一名詞 定距資料 對事物類別或次序之間...

統計學整理

1 統計學是一門收集 整理和分析大量統計資料的方法科學,其目的是探索資料的內在數量規律性,從而科學地認識客觀事物 2 時間序列的描述性基本指標有兩類 一類是現象發展的水平指標 一類是現象發展的速度指標。時間序列中各指標的數值稱為發展水平 3 增長量是時間序列中的報告期水平與基期水平之差,用於描述現象...

統計學 統計學基礎

五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...