資料分析該分析什麼

2021-09-23 07:14:55 字數 2004 閱讀 5579

很多時候我們走的走的就會忘記當初為什麼而出發。

我們有的時候在拿到資料以後不知道該怎麼進行分析,該去分析什麼,其實這些在我們以前的統計學中都學過。

不管是用python還是r,其實和用excel一樣,只不過現在之所以用python、r是因為大資料時代麼,資料太多,excel的處理能力跟不上,但是這些都只是乙個工具而已,核心還是圍繞統計學不變的。

今天就來聊聊我們該從哪些方向去分析(描述)資料。

01 總規模度量:

總量指標又稱統計絕對數,是反映某一資料的整體規模大小,總量多少的指標。他是對原始資料經管分組和彙總以後得到的各項總計數字,是統計整理階段的直接成功。

比如鐵達尼號資料中總共有891條乘客資料,其中有342是倖存者。

02 相對度量:

相對指標是說明現象之間數量對比關係的指標,由兩個有聯絡的指標數值對比而求得,其結果表現為相對數,相對數的重要特點就是把兩個具體的數值概括為乙個抽象的數.

比如:鐵達尼號資料中我們可以把存者資料和所有乘客資料的相比概括為為倖存率這麼乙個數。

相對數有有單位和無單位兩種表現形式,在相對指標中,大多數都是以無單位的形式表示的,無單位是一種抽象化的數值,常以係數、倍數、百分數等表示;而有單位主要是用來表現強度相對指標的數值,比如人口密度:「人/平方公里」。

03 集中趨勢的度量:

集中趨勢是通過指標反映某一現象在一定時間段內所達到的一般水平。用平均指標來表示。平均指標分為數值平均和位置平均。

比如:鐵達尼號資料中平均年齡和平均票價。

1、數值平均是統計數列中所有變數值平均的結果。有普通平均數和加權平均數兩種。

2、位置平均時基於某種特殊位置上或者是普遍出現的標誌值作為整體一般水平的代表值。有眾數、中位數兩種。

眾數是被研究總體**現次數最多的變數值,他是總體中最普遍的值,因此可以用來代表一般水平。如果資料可以分為多組,則為每組找出乙個眾數。注意:眾數只有在總體內單位充分多時才有意義。

中位數是將總體中各單位標誌值按大小順序排列,處於中間位置的變數值就是中位數。因為處於中間位置,有一半變數值大於該值,一半小於該值,所以可以用這樣的中等水平來表示整體的一般水平。

04 離散程度的度量:

變異指標是用來表示總體分布的變異情況和離散程度的指標,通過變異程度也可以看出平均值指標的代表性程度,如果離散程度小,說明大部分資料都是挨著的,則平均值可以很好的反映整體情況的一般水平,反之相反。

全距(又稱極差)、方差、標準差等幾個指標是用來衡量數值的分散性和變異性。

1、全距(極差):平均數讓我們有辦法確定一批資料的中心,但是無法知道資料的變動情況,所以引入全距,全距的計算方法是用資料集中最大數(上界)減去資料集中最小數(下屆)。

全距存在的問題:

2、對於第一種問題我們引入四分位距的概念。四分位數將一些數值從小到大排列,然後一分為四,最小的四分位數為下四分位數,最大的四分位數為上四分位數,中間的四分位數為中位數。

3、對於問題2我們引入了方差和標準差兩個概念來度量資料的分散性。

05 偏態與峰度的度量:

1、偏度是用來衡量統計分布的不對稱程度或偏斜程度的指標,值越大,偏斜成度越大;值越小,偏斜成度越小。

2、峰度又稱峰態係數。表徵概率密度分布曲線在平均值處峰值高低的特徵數。直**來,峰度反映了峰部的尖度。值越大,越尖。

06 相關性度量:

上面提到的幾個維度是對資料整體的情況進行描述,但是我們有的時候想看一下資料整體內的變數之間存在什麼關係,乙個變化時會引起另乙個怎麼變化,我們把用來反映這種關係的指標叫做相關係數。

(相關係數計算公式)

r的正負代表相關性方向,正代表正相關,負代表負相關。

什麼是資料分析!!!

資料分析是乙個從資料中通過分析手段發現業務價值的過程。這個過程的起點是獲取乙份資料,這個過程的終點是發現業務價值。過程可以大致為分資料獲取 資料清洗 資料處理 資料建模 分析結果呈現 業務價值發現 業務價值實現這幾個階段。過程的詳細說明 注 在做分析之前,一定要有目標 過程不是單向的,在後乙個階段中...

資料分析 python 用途 資料分析有什麼作用?

相比大家傳統理解的 資料分析即覆盤 其實資料分析還有更深層次的 驅動業務 能力。資料分析在業務驅動的過程當中扮演怎樣的角色 01 資料為治之而非統之 通常資料分析工作主要圍繞產品 市場和運營三大業務場景。以個人經驗談來說,我資料分析工作的分別為遊戲 ip引進把關 為遊戲立項把關 為遊戲研發把關 為資...

資料分析 資料分析概述

了解業務 了解資料 確認業務和資料 預期分析和管理 資料分析方式01.了解資料資料 1.測量標度型別 屬性本源並不是數字或者符號,通過測量標度將數值或者符號和物件的屬性建立關聯。屬性的型別 測量尺度 nominal 標稱 等於或者不等於 一對一的變換 ordinal 序數 大於或者小於 單調函式的變...