小白需要了解的統計學基礎概念

2021-08-21 20:37:53 字數 1548 閱讀 4335

1.統計學

統計學可以分為:描述統計學推斷統計學

描述統計學:使用特定的數字或圖表來體現資料的集中程度和離散程度。例:每次考試算的平均分,最高分,各個分段的人數分布等,也是屬於統計學的範圍。

推斷統計學:根據樣本資料推斷總體的資料特徵。例:產品質量檢查,一般採用抽檢,根據所抽樣本的質量合格率作為總體的質量合格率的乙個統計

應用:統計學的應用十分廣泛,可以說,只要有資料,就有統計學的用武之地。目前比較熱門的應用:經濟學,醫學,心理學等

2.掌握內容

均值:算數平均數

中位數:將資料按大小排列後位於正中間的數描述,描述中等水平

眾數:資料中出現最多的數

3.示例

均值舉個例子:

中位數舉個例子:

眾數舉個例子:

4.優缺點:

5.離散程度

比較資料 a:1,2,5,8,9 b:3,4,5,6,7

圖中a的分散性比b大

6.方差

在統計學上,更常地是使用方差來描述資料的離散程度–資料離中心越遠越離散

方差簡化公式:

例如1,2,5,8,9

(1*1+2*2+5*5+8*8+9*9)/5 -pow((1+2+5+8+9)/5)

=35-23

=107.標準差

由資料1,2,5,8,9,求出方差為10,與原資料比較,可以看出10比原資料都大,是否說明這一組資料十分離散呢??–但是方差與元資料的單位是不一樣的,這樣的比較是無意義的。如果原資料的單位是m的話,那麼方差的單位就是m的二次方。

為了保持單位的一致性,我們引入乙個新的統計量—-標準差

標準差:有效的避免了因單位而引起的度量問題

與方差一樣,標準差的值越大,表示資料越分散

8.了解資料構成的圖

直方圖、箱線圖、莖葉圖、線圖、柱形圖、餅圖等圖可準確描述資料在使用中的作用度。

幾個統計學的概念

在多元變數分析中,我們考慮所有的 d 個數值型屬性 x 1,cdots,x d 整個資料集是乙個 n times d 的矩陣,即 資料矩陣 d left begin x 1 x 2 cdots x d hline x 1 t x x cdots x x 2 t x x cdots x vdots v...

在統計學中 統計學中的基本概念

統計學的幾個基本概念 總體和總體單位 1.總體 總體的概念 總體是指客觀存在的 具有某種共同性質的 許多個別事物組成的整體 在統計研究過程當中,統計研究的目的和任務居於支配和主導的 地位,有什麼樣的研究目的就應該有什麼樣的統計總體與之相適應。例如 要研究我們學院教師的工資情況,那麼全體教師就是研究的...

機器學習中需要了解的概念

機器學習有大塊的知識,也有零碎的知識,我們在學習機器學習的時候不能忽視這些零碎的知識。如果對這些知識忽視,那麼就容易讓自己的知識架構殘缺不全。如果對這些知識的了解充分,我們就能夠更好地理解機器學習。下面我們就為大家介紹機器學習中的基礎知識。1 廣義線性模型就是最小二乘回歸模型的推廣 泛化,基於高斯雜...