統計學 變數 資料 抽樣

2021-09-29 01:47:36 字數 1653 閱讀 3006

變數值是變數的取值

變數的型別

1.1 分類變數

1.2 順序變數

1.3 數值型變數

另,根據其取值不同又可分為:離散型變數、連續型變數

資料處理:將資料用圖表等形式展現出來;

資料分析:選擇適當的統計方法研究資料,並從資料中提取有用資訊進而得出結論,具體方法有描述統計和推斷統計。

推斷統計:

如何利用樣本資料來推斷總體特徵的統計方法。

截面資料

時間序列資料

統計量,根據樣本資料計算得出,是樣本的函式。

分類資料和順序資料,一般是由文本來表述,又被稱為定性資料和品質資料。

變數分類:

分類變數、順序變數、數值型變數。

概率抽樣:每乙個單位都有一定機會(已知的,可計算的非零概率)被抽到,可以以相等(等概率抽樣)也可以不相等(不等概率抽樣)。

特點:隨機原則抽取樣本;

概率抽樣可以依據調查結果,計算估計量誤差,從而得到對總體目標量進行估計的可靠程度。也可以按照要求的精確度,計算出必要的樣本數目。

概率抽樣的方式:

2.1. 簡單隨機抽樣:

從抽樣框(抽樣框包含所有總體單位的資訊,作用:提供備菜單位以供抽選,計算相應的概率)中進行;

從總體中的n個單位乙個乙個地抽取,每個單位都是相等的,是一種等概率抽樣;

是一種最基本的抽樣方式,是抽樣方式的基礎;

特點:簡單直觀,在抽樣框完整的時候,可以直接抽取樣本,由於抽選的概率相同,用樣本統計量對目標量進行估計及計算估計量誤差都比較方便

侷限性:當n很大時,抽樣框不宜選取;抽出的單位很分散;沒有利用輔助資訊提高估計的效率。

2.2 分層抽樣

先劃分不同層,然後從各層中抽取。

保證了樣本與總體結構相近。

2.3 整群抽樣

分組(把這樣的組稱為群),然後直接抽群,對群中的所有的單位實施調查。

優點:簡化了編制抽樣框的工作量,較為簡便。

缺點:估計精度比較差。

2.4 系統抽樣

對總體中的所有單位進行排序,選取初始單位,按照一定的規則確定其他樣本。

2.5 多階段抽樣

類似整群抽樣,區別是從抽出的群裡進行再次抽樣,依次推廣,即為多階段抽樣。

優點:樣本相對集中,節約調查費用。

在較大規模的抽樣調查中,多階段抽樣經常使用

非概率抽樣:

特點:抽取樣本不遵循隨機原則,而是根據研究目的對資料的要求,採用某種方法進行抽樣。有如下幾種:

3.1 方便抽樣

依據方便的原則,自行確定入菜單位。

容易實施,但不能將結果推廣到總體當中。

3.2 判斷抽樣

根據以往經驗,有目的的地選取樣本,主觀的。又可分為:重點抽樣、典型抽樣、代表抽樣。

3.3 自願抽樣

3.4 滾雪球抽樣

先對稀少群體調查,之後再請他們提供另外的調查物件,持續下去。

特點:適合對特定頂群體進行研究、搜取資料。

3.5 配額抽樣

類似於概率抽樣的分層抽樣,先分層、再在各層中進行方便抽樣、判斷抽樣等選取單位。

蒐集資料:

自填式、**式、面訪式、觀察式。

實驗資料:

隨機原則分配給實驗組和對照組。

匹配,情況相同的每隊單位分別分配給實驗組和對照組。

統計學(3) 資料抽樣方法的細節

全面調查與抽樣調查是資料收集過程中最常用的2種方法。1.全面調查 就是對調查物件逐個排查。優點 得到的資料全面,可靠 缺點 耗費人力物力財力 調查時間長 適用範圍 範圍比較小 容易掌控 不具有破壞性 可操作性強 2.抽樣調查 是從總體中,抽取若干個體 即樣本 進行調查 優點 耗費的人力物力財力少 大...

統計學 統計學基礎

五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...

征服統計學06 統計模型 抽樣分布是什麼?

本文介紹統計模型和抽樣分布基本知識。統計模型描述變數之間的關係,如上圖的黑色直線就是乙個描述小鼠體格和體重關係的線型模型 模型是對真實資料的近似估計,如上圖y軸方向的虛線長表示模型估計與真實資料之間距離 我們用大量實驗資料去驗證模型是否健壯。實際生活中,常常無法直接研究總體,需要隨機抽取樣本代以研究...