資料分析方法之分解分析介紹

2021-06-15 11:26:55 字數 727 閱讀 3810

在bi系統中,分解分析是結合結構分析與因素分析的一種視覺化的資料分析方法,它可通過使用者互動式的分析操作過程,構造出樹形的分解結構,並結合80/20原理圖來展現因子的資料分布情況。分解分析可用於分析kpi指標的構成因子及其貢獻度。

資料分析之分解分析

在分解樹節點上可顯示多種資訊,如指標的數值、佔比、對比值、趨勢、預警等。在對分解分析進行視覺化實現時得出的經驗是最多同時顯示2個資訊項時效果最佳。

使用者進行分解分析時,可以通過以下兩種方式逐層分解:

1)  向下鑽取的方式,自頂向下進行逐層進行分解具有不同粒度層次約束關係的指標。如:費用指標,可以分解到管理費用、營業費用、財務費用等指標,管理費用指標又可以進一步分解到工資、福利、辦公費、差旅費、業務招待費等指標,依次繼續……。

2)  橫向鑽取的方式,在分解分析過程的中間步驟,對關注的因子節點引入新的約束維度,以便進一步細化資料的粒度,如:將費用指標分解到業務招待費後,可引入部門維度,從而在業務招待費因子節點下分解出各個部門的業務招待費構成及佔比,進一步針對銷售部引入時間維度上的月份級別,則可以在銷售部節點下分解出該部門各月份的招待費用構成及佔比,依次繼續……。

在實現分解分析的資料視覺化手段時,同時支援向下鑽取、橫向鑽取兩種方式可有效幫助使用者根據需要選擇分析路徑。

另外,如何呈現分解樹(保留使用者分解操作的全樹,還是當前樹節點的關鍵路徑),分解樹節點展開、收回等操作是否直觀、便利,對節點所含資料項的配置是否方便,以及節點資料的顯示方式等方面,也非常影響使用者的資料分析體驗。

資料分析之分布分析

aggresult data.groupby by 年齡 年齡 agg 可以看到分組已經成功,但是結果不直觀,從結果反映不出每個年齡的人數 進行數值分段處理 bins min data.年齡 1,20,30,40,max data.年齡 1 labels 20歲及以下 21歲到30歲 31歲到40歲...

資料分析之分布函式

一.概念解釋 pdf 概率密度函式 probability density function 在數學中,連續型隨機變數的概率密度函式 在不至於混淆時可以簡稱為密度函式 是乙個描述這個隨機變數的輸出值,在某個確定的取值點附近的可能性的函式。pmf 概率質量函式 probability mass fun...

資料分析之分析美國人口

資料 需求 匯入檔案,檢視原始資料 將人口資料和各州簡稱資料進行合併 將合併的資料中重複的abbreviation列進行刪除 檢視存在缺失資料的列 找到有哪些state region使得state的值為nan,進行去重操作 為找到的這些state region的state項補上正確的值,從而去除掉s...