這篇文章把資料講透了(五) 資料視覺化(下)

2021-10-17 18:40:49 字數 3066 閱讀 4185

上幾期文章中,我們已經了解到「資料」是乙個龐大的體系(如下圖所示),並用了菜市場的例子,為大家講解資料**的含義;用買菜的例子,為大家講解資料採集的步驟;用洗菜、擇菜的例子,為大家講解資料清洗的方法…

而今天主要給大家講解,我們學會做菜以後,怎樣把烹飪方法簡單易懂的傳授給他人,即資料視覺化的過程。

先上圖表選取原則乾貨(見下圖),下面我們再針對每個**的使用進行逐一講解!

(1)餅類

一般情況下,我們會選擇餅圖來呈現成分的對比關係。而餅圖使用也存在下面這些「潛規則」

a.遵循閱讀習慣,餅圖成分重要性需要呈順時針順序

在閱讀餅圖時,人們都會下意識的從12點鐘方向,順時針讀下去。所以,為了迎合人們的閱讀習慣,我們需要將資料的佔比大小、重要性按照順時針方向切片展示。

b.切片數量不要超過7個,如果餅圖類別很細,對於受眾而言,對比起來是非常困難的。所以,當你發現切片數量將超過6個時,將其餘不那麼重要的分支整合歸為「其他」項。

c.盡量避免使用立體餅圖,除非你真的有信心避免視覺錯覺。

如下圖所示,從受眾的角度看這張立體餅圖,是不是很難分清楚兩個佔比最小的扇形究竟誰大誰小?而如果我們採用「俯視」的視角看這張餅圖,就會好區分很多!

首先,我們需要明確項類對比的含義是什麼,以及它指的對比維度是什麼?一般來說,常見的維度對比無外乎資料大小、佔比這兩類。而就圖表型別而言,項類對比最常用圖表型別為條形圖,下面我們來談一談條形圖使用的原則。

(1)符合嘗試的預設排序(從大到小、從高到低、從好到差),除非你需要遵循其他邏輯排序

一般來說,人們看條形圖比較想要獲取的是頭部項類對比訊息,沒有人會特別注意尾部項類的佔比和對比。所以為了迎合人們的閱讀習慣,我們需要按照從大到小、從高到低、從好到差的預設條形圖排序實現繪製。

當然,遵循其他特定的邏輯排序也是可取的。例如,某公司對比業內競爭者市場佔比時,特意按照進入市場的時間長短進行條形圖排序。如下所示,是按照品牌邏輯對條形圖進行展示。

(2)條形圖間隔《條形圖本身寬度

麥肯錫條形圖的分類間距一般設定為本身寬度的20%-50%;而經濟學人的分類間距則為50%-80%,保潔等大型公司的報表中也呈現10%-30%不等。如下所示,是經濟學人一篇文章中的散點圖和條形圖。

雖然,間距不一,但不難發現,業內幾乎沒有分類間距》條形寬度本身的。

時間序列,顧名思義,就是一條時間線下資料類別、變數的變化;而頻率分布可能會稍微難懂一點,但我相信看到下面這個例子,你就不陌生了!

相信大家大學上《概率論》的時候,都看過這個函式!概率密度函式,沒錯,他就表示了頻率分布!

時間序列、頻率分布製圖時,通常選取柱形圖、折線圖兩類,而這兩類值間應該怎樣進行選取呢?

在麥肯錫的《用圖表說話》一書中,建議以8個時間點為區分界限,當時間點》8時,採用折線圖,減少視覺對比疲勞,當時間點<8時,選取柱形圖。以下是柱狀圖、折線圖兩種圖表的使用規則。

其次,柱狀圖和折線圖的選擇還和資料特徵有關,當你想凸顯特定時間段內產量、銷量等資料指標的時間序列變化,用柱狀圖比較合適,因為它還能夠凸顯程度、數量;而折線圖則更注重變化、變化趨勢,在表現資料發展趨勢和時間序列**分析中較為常用。

(1)柱形圖

a.柱形圖間隔《柱形圖本身寬度

這一點其實和條形圖類似,此處就不做贅述了

b.堆積柱狀圖使用有度,避免對比混亂

堆積柱狀圖適用於對比多個專案、類別的成分關係,是表達成分對比關係的重要方式。

但需要特別注意,百分比堆積圖盡量不要對比每個類項超出3個細分成分,否則會帶來對比混亂。如下所示,堆積柱狀圖的類項已然超過3個,對比起來就會很混亂。

(2)折線圖

a.趨勢線要突出(顏色、粗細等)

折線圖是以上圖表中,最能夠直觀展示上公升、下降、波動、維持原狀趨勢的圖表,它側重於勾勒變化和變化趨勢,用於表達資料的發展趨勢。

但,趨勢線作為折線圖中的主體,一定要突出。而這個突出,可以是顏色上的突出,使用紅色等重點色;也可以是粗細上的突出,比如,我們一定要注意到折線圖趨勢線比網格線、刻度線粗!

相關性分析中,我們常使用散點圖直觀地顯示變數間的相關強度、相關方向,並用於探索性資料分析,做出擬合曲線和回歸方程,對未來趨勢進行探索性**。

(1)散點、氣泡圖

a.散點、氣泡大小需要直觀

人都是視覺動物,而圖表需要做到就是把人的視覺利用到極致!散點圖、氣泡圖中,每乙個散點、氣泡就代表著乙個樣本個體,而散點、氣泡的大小就能只管的展示出該樣本的大小。所以,我們在製作圖表時,需要充分利用這一點,用散點、氣泡大小直觀的展示樣本間的關係。

以上,就是本期視覺化圖表選取原則的全部內容!我們【這篇文章把資料講透了】系列到這裡也就完結了!撒花!!

接下來,你想看哪方面的文章呢?

這篇文章把資料講透了(五) 資料視覺化(上)

上幾期文章中,我們已經了解到 資料 是乙個龐大的體系 如下圖所示 並用了菜市場的例子,為大家講解資料 的含義 用買菜的例子,為大家講解資料採集的步驟 用洗菜 擇菜的例子,為大家講解資料清洗的方法 而今天主要給大家講解,我們學會做菜以後,怎樣把烹飪方法簡單易懂的傳授給他人,即資料視覺化的過程。我們知道...

什麼是資料標準?如何建設管理?這篇文章給你講明白了

在數字經濟快速發展的今天,為了善用日積月累的大資料資訊,挖掘資料背後的價值,更加高效的產生資料效益,許多公司走上了資料治理的踐行之路。可是面對日漸繁雜,結構不一的資料,企業進行資料治理並不是一件簡單的事情,首先橫亙在面前的最大問題就是資料間的不一致性。而資料標準管理,則是為解決這一資料病症而誕生的一...

2 精通MATLAB資料型別看這篇文章就夠了

學習目標 1 資料型別的強制轉換,數值範圍 2 取整函式的使用學習 3 複數的使用學習 clear all shu 66 雙精度浮點型,強制轉換成整型 shu8 int8 shu shu16 int16 shu shu32 int32 shu shu64 int64 shu zifuchuan da...