描述性統計

2021-10-03 03:28:48 字數 861 閱讀 9784

資料分布特徵可以從以下三個方面來描述:資料的水平,反應資料的集中程度;資料的差異,反應資料的離散程度;資料的分布形狀,反應數分布的偏態和峰態。

描述資料水平的統計量:平均數、中位數、分位數、眾數。

1.1.1 概念

1.1.2 優缺點1.2.1 眾數

1.2.2 中位數

1.2.3 分位數

分位數與中位數類似,他們也是將資料分成幾等分,比如, 四分位數、十分位數 、百分位數分別用3個點、9個點、99個點將資料4等分、10等分、100等分。

最常用的是四分位數。

這裡我們將分位數和箱線圖放到一起來介紹。

我們先來介紹幾個概念。

上相鄰值:上下內圍欄中的最大值

下相鄰值:下內圍欄中的最小值

須線:用直線將上下相鄰值分別與箱子連線。

離群點/外部點:大於上內圍欄或者小於下內圍欄的數值。

我們在理解上面的概念時,可以結合下面的圖來看,會更清晰。

1.2.3 箱線圖

箱線圖怎麼來分析呢?

1.2.4 使用場景

一般是把中位數和四分位數放到一起來說。

因為中位數(四分位數)、眾數不受異常值的影響,當資料為偏態分布,特別是偏斜程度較大時,可以選擇它們來進行分析;檢視資料的分布情況,比較不同資料的分布;識別異常值。

描述資料離散程度:極差、四分位數差、方差和標準差

標準差:s=方差開平方

標準差與原始資料具有相同的計量單位,實際意義比方差要更清楚,所以標準差更常用。

2.4 離散係數偏態係數和峰態係數對分布對對稱程度和峰值高低的一種度量。

描述性統計

上一節,我們談了資料視覺化,並且用python 對影象進行了簡單的實現。但是,這僅僅使得我們對資料分布的形狀和特徵有了乙個大概的了解。想要全面了解資料分布的特徵,還需要找到反應資料分布特徵的各個代表值。資料分布的特徵可以從三個方面進行測度和描述 1 分布的集中趨勢,反應各資料向其中心值靠攏或聚集的程...

描述性統計

眾數 一組資料 現最多的變數值 中位數 一組資料排序後處於中間位置上的變數值 分位數 四分位數 十分位數 百分位數 平均數 一組資料相加後除以資料個數的結果值 各變數值倒數的平均倒數,稱為調和平均數 n個變數值乘積的n次方根,稱為幾何平均數 眾數是一組資料分布的峰值,是一種位置代表值,不受值極端的影...

描述性統計

選擇你想要統計的指標,點選確定 得到描述性統計 圖形 舊對話方塊 散點圖 點圖 矩陣散點圖 定義 將變數全部移到右邊 確定 生成如下散點圖 若從散點圖中能夠看到兩個變數之間呈大概的線性關係,則計算其相關係數 否則判斷其線性相關程度低。clear clc load physical fitness t...