資料分析總結四 視覺化與資料分析

2021-09-06 15:52:25 字數 1772 閱讀 3770

資料視覺化

資料視覺化的目的是讓資料更高效,讓讀者更高效閱讀,而不單是自己使用,突出資料背後的規律、突出重要的因素,最後是美觀。

散點圖主要解釋資料之間的規律。

氣泡圖是散點圖的變種, 引入了第三個度量作為 氣泡的大小。

維度作y軸,更傾向於洞 察資料在不同類別下的 資料規律

消費金額和消費次數的關係 消費金額和最後一次距今消費天數的關係 消費次數和最後一次距今消費天數的關係 01 散點圖 客戶其他消費維度

消費金額和會員積分的關係 消費次數和會員距離的關係

投資金額和投資次數的關係(金融) 最近一次距今消費和使用次數(saas)

折線圖經常用來觀察數 據隨時間變化的趨勢。 折線圖中的維度不宜過 多,否則會非常混亂和 複雜。

面積圖是折線圖的變種。 面積圖更注重資料類別之間隨著時間趨勢的變化關係。

柱形圖是類別之間的關係。

柱形圖的統計型變種。

餅圖可以理解為環狀的柱形圖。餅圖的類別不宜過多。餅圖除了ppt, 分析時沒啥用。

漏斗圖是對轉化過程的直觀展示。單一的漏斗圖沒啥用,也是面向 ppt。漏斗圖的轉化步驟不應該超過七個。

適用於個體的資料和屬性視覺化,比較偏描述性資料,常見於crm, 使用者畫像。

適合資料量較大的情況, 尤其類別較多。比如各類電商的庫存量(sku)。

桑吉圖是揭示資料複雜 變化趨勢的圖表。面積 圖是線性維度,而桑基 圖可以一對多或者多對一。

資料在空間上的變化規律。譬如地理空間,譬如網頁瀏覽

空間不一定是純粹空間, 也可以是屬性和維度的規律組合,比如把它變成星期表或者日曆表。

展現不同類別之間的數 據關係,常見於各類社交社會**。

箱線圖是統計用圖表,用來研究和觀察資料分布,也能對比資料分布。

也稱為子彈圖,是變種 的條形圖。常用於衡量 業務銷售完成情況。

文字分析利器,ppt常客,賣弄大資料之必備圖表

資料和空間之間的關係。地理圖即可以通過經緯度的數值度量繪製,也能通過省市的類別維度繪製。

可用excel繪製,也可以用python進行繪製。

主 次 分 明

貼 合 場 景

指 標 結 構

who 是誰在使用?

what 使用者的目的是什麼?

how 使用者怎麼使用?

資料分析與視覺化

1.pip包管理 1 內建庫 包 庫 別人寫好的 直接引用,加快開發效率。內建包 python直譯器內建常用功能庫。直譯器安裝目錄 lib資料夾下,os time urllib等 資料夾裡有 init py 就成了乙個包。2 關於http模擬和html源 解析 python時代 urllib url...

資料分析與視覺化(python)

print 中 encode encoding gbk b xd6 xd0 gbk編碼 乙個漢字兩個位元組 為了節省流量 國內有人仍堅持gbk 中 encode encoding utf 8 對於中文,gbk比utf8節省三分之一的空間 解碼 二進位制 自然資訊 eg b xd6 xd0 decod...

Python 資料分析視覺化

1 畫圖需要使用 matplotlib這個包 如下 importmatplotlib.pyplotasplt year 1950,1970,1990,2010 pop 2.519,3.692,5.263,6.972 values 0,0.6,1.4,1.6,2.2,2.5,2.6,3.2,3.5,3...