大資料學習 常用的資料分析法和模型

2021-07-28 22:22:20 字數 1324 閱讀 6813

將某參量的數值範圍等分為若干區間,統計該參量在各個區間上出現的頻率,並用矩形條的長度表示頻率的大小。

箱線圖(boxplot)也稱箱須圖(box-whisker plot),是利用資料中的五個統計量:最小值、第一四分位數、中位數、第三四分位數與最大值來描述資料的一種方法,它也可以粗略地看出資料是否具有有對稱性,分布的分散程度等資訊,特別可以用於對幾個樣本的比較。

描述流程特性值在一段時間內變化波動的趨勢和規律的統計工具,如整個流程大體在什麼範圍內執行、是否具有波動較大的時期或時點等。

散點圖(scatter diagram),在回歸分析中,資料點在直角座標系平面上的分布圖。

散點圖表示因變數隨自變數而變化的大致趨勢,據此可以選擇合適的函式對資料點進行擬合。

百科對此有更詳細解釋:

百科鏈結

示例:

對比分析就是將兩個或兩個以上的資料進行比較,分析它們之間的差異,從而揭示這些資料所代表事物的發展變化情況和規律。通過對比,可以很直觀地看出事物在某方面的差距,並且可以準確、量化地表示出差距的多少。

實際使用中使用簡單的柱狀圖可進行對比圖分析。

運用計算平均數的方法反應總體在一段時間、地點條件下,某一數量特徵的一般水平。平均指標既可用於同一現象在不同地區、不同部門間的橫向比較,也可用於同一現象在不同時間的對比。

趨勢平均法是指以最近若干時期的平均值為基礎,來計算**期預期值的一種方法。趨勢平均法指在移動平均法計算n期時間序列移動平均值的基礎上,進一步計算趨勢值的移動平均值,進而利用特定基期銷售量移動平均值和趨勢值移動平均值來**未來銷售量的一種方法。

漏斗圖適用於業務流程比較規範、周期長、環節多的流程分析,通過漏斗各環節業務資料的比較,能夠直觀地發現和說明問題。

在**分析中,通常用於轉化率比較。

示例:

本文參考:

資料分析方法中的杜邦分析法

我們在前面提到了5w2h方法,以及aarrr模型,5w2h就是5w2h分析法的內容,有7個單詞組成,分別是what 使用者要什麼?why 為什麼要?where 從哪兒得到?when 我們什麼時候做?who 對誰做?how much 給多少?how 怎麼做?這種方法是乙個很經典的方法,而aarrr模型...

資料分析方法中的杜邦分析法

我們在前面提到了5w2h方法,以及aarrr模型,5w2h就是5w2h分析法的內容,有7個單詞組成,分別是what 使用者要什麼?why 為什麼要?where 從哪兒得到?when 我們什麼時候做?who 對誰做?how much 給多少?how 怎麼做?這種方法是乙個很經典的方法,而aarrr模型...

資料分析中的分組分析法(二)

數量指標分組分析法有單項式分組和組距式分組。現在我們給大家說一說單項式分組。單項式分組一般適用於離散型資料,而且資料值不多 變動範圍較小的情況。每個指標值就是乙個組,有多少個指標值就分成多少個組。如按產品產量 技術級別 員工工齡等指標分組。然後就是組距式分組是指資料的變化幅度較大的條件下,將資料總體...