常用資料分析的基本方法

2021-10-04 21:40:40 字數 2350 閱讀 8300

之前學習了資料分析方法的三大作用:現狀分析、原因分析、**分析。

這三大作用可分別對應於對比、細分、**三大基本方法。

定義:指兩個或兩個以上的資料進行比較,分析它們的差異,從而揭示某些資料所代表的事物發展變化情況和規律性。

特點:可以直觀地看出事物某方面的變化或差距,並且可以準確、量化地表示出這種變化或差距是多少。

分類:對比分析法可分為靜態對比和動態對比兩類

靜態比較是指在同一時間條件下對不同總體指標地比較,如不同部門、不同國家之間地比較,也叫橫向比較,簡稱橫比。(與目標對比、行業內對比)

動態比較是指在同一總體條件下對不同時期指標數值地比較,也叫縱向比較,簡稱縱比。(不同時期對比、活動效果對比)

注意事項

做資料分析不僅要對總體地數量特徵和數量關係進行分析,還要深入總體的內部進行分組分析。這種方法是根據資料分析物件的特徵,按照一定的指標,把資料分析物件劃分為不同的部分和型別來進行研究,以揭示其內在的聯絡和規律性。

目的:便於對比。

關鍵:確定組數和組距。

定義:是指被分析總體內的各部分與總體之間進行對比的分析方法,即總體內各部分佔總體的比例,屬於相對指標。

結構相對指標(比例)的計算公式為:

結構相對指標 = (總體某部分的數值/總體數量)*100%

例如: 市場占有率 = (某商品銷售量/該商品市場銷售總理)*100%定義:指運用計算平均數的方法來反映總體在一定時間、地點條件下某一數量特徵的一般水平。

主要作用:

利用平均指標對比同類現象在不同地區、不同行業、不同型別單位等之間的差異程度,比用總量指標對比更具有說服力。

利用平均指標對比某些現象在不同歷史時期的變化,更能說明其發展趨勢和規律。

平均指標有算術平均、調和平均數、幾何平均數、眾數和中位數。

平均分析法要結合各種分組和指標對比來進行

交叉分析法通常用於分析兩個變數(字段)之間的關係,即同時將兩個有一定聯絡的變數及其值交叉排列在一張**內,使各變數值成為不同變數的交叉結點,形成交叉表,從而分析交叉表中變數之間的關係。

綜合評價分析法的基本思想是將多個指標轉化為乙個能夠反映情況的指標來進行分析評價,比如不同國家的經濟實力等。

步驟:

綜合評價分析法主要特點:

資料標準化的方法:(也可叫做特徵歸一化)

按比例縮放到0-1之間,也叫離差標準化:

0均值標準化:0均值歸一化方法將原始資料集歸一化為均值為0、方差1的資料集,歸一化公式如下:μ是均

值\mu 是均值

μ是均值

,σ 是標

準差\sigma 是標準差

σ是標準

差權重確定方法:

確定指標權重的方法較多,比如專家訪談法、層次分析法、主成分分析法、回歸分析法等。簡單的有目標優化矩陣法。

杜邦分析法(dupont analysis)是利用幾種主要的財務比率之間的關係來綜合地分析企業的財務狀況。具體來說,它是一種用來評價公司盈利能力和股東權益回報水平,從財務角度評價企業績效的一種經典方法。其基本思想是將企業淨資產收益率逐級分解為多項財務比率乘積,這樣有助於深入分析比較企業經營業績。

漏斗圖是乙個適合業務流程比較規範、週期比較長、各流程環節涉及複雜業務過程比較多的管理分析工具。

例如漏斗圖用於**中關鍵路徑的轉化率分析:

單一漏斗圖無法評價**某個關鍵流程中各步驟轉化率的好壞,這時需要結合其它分析方法進行對比分析。

定義:矩陣分析法是指根據事物(如產品、服務等)的兩個重要性(指標)作為分析的一句,進行分類關聯分析,找出解決問題的一種分析方法。如圖:

象限法在解決問題和資源分配時,為決策者提供重要的參考依據。先解決主要矛盾,再解決次要矛盾,有利於提高工作效率,並將資源分配到最能產生績效的部門、工作中,有利於決策者進行資源優化配置。

常用資料分析方法

自 一 描述性統計 描述性統計是一類統計方法的彙總,揭示了資料分布特性。它主要包括資料的頻數分析 資料的集中趨勢分析 資料離散程度分析 資料的分布以及一些基本的統計圖形。1 缺失值填充 常用方法有剔除法 均值法 決策樹法。2 正態性檢驗 很多統計方法都要求數值服從或近似服從正態分佈,所以在做資料分析...

常用大資料分析方法

資料探勘分析,最重要的是能夠將資料轉化為非專業人士也能夠清除理解的有意義的見解。資料探勘分析,可以被分為四類核心方法 是最常見的資料分析方法。在業務中,這種方法向資料分析師提供了重要指標和業務的衡量方法。例如 每月的營收和損失賬單。資料分析師可以通過這些賬單,獲得大量的客戶資料。了解客戶的地理資訊,...

Pandas資料分析常用方法

指定索引列 names 列名陣列,預設值 none,用於讀取資料的指定列名 eg1 catering sale catering sale.xls data pd.read excel catering sale,names date sale 外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接...