資料視覺化(三) Seaborn簡易入門

2021-08-09 21:28:26 字數 2580 閱讀 8330

seaborn其實是在matplotlib的基礎上進行了更高階的api封裝,從而使得作圖更加容易,在大多數情況下使用seaborn就能做出很具有吸引力的圖,而使用matplotlib就能製作具有更多特色的圖。應該把seaborn視為matplotlib的補充,而不是替代物。

安裝seaborn的方法

pip install seaborn
原始資料展現(這是乙份家庭調查的資料,preglngth - 懷孕周長, birthord - 孕婦的第幾個孩子, birthwgt_lb1 - 嬰兒重量(單位:磅), birthwgt_oz1 - 嬰兒重量(單位:盅司), agepreg - 孕婦在分娩時的年齡)

import pandas as pd

births = pd.read_csv('

births.csv

')

直方圖

#

對上表的prglngth列做乙個直方圖

import matplotlib.pyplot as plt

import seaborn as sns #

要注意的是一旦匯入了seaborn,matplotlib的預設作圖風格就會被覆蓋成seaborn的格式

%matplotlib inline #

為了在jupyter notebook裡作圖,需要用到這個命令

sns.distplot(births['

prglngth

'])sns.plt.show()

可以看到與使用matplotlib作的直方圖最大的區別在於有一條密度曲線(kde),可以通過設定引數去掉這條預設的曲線

那麼pandas與seaborn之間有什麼區別呢?

其實兩者都是使用了matplotlib來作圖,但是有非常不同的設計差異

在只需要簡單地作圖時直接用pandas,但要想做出更加吸引人,更豐富的圖就可以使用seaborn

pandas的作圖函式並沒有太多的引數來調整圖形,所以你必須要深入了解matplotlib

seaborn的作圖函式中提供了大量的引數來調整圖形,所以並不需要太深入了解matplotlib

seaborn的api:

#

對上圖進行更多的配置

sns.set_style('

dark

') #

該圖使用黑色為背景色

sns.distplot(births['

prglngth

'], kde=false) #

不顯示密度曲線

sns.axlabel('

birth number

', '

frequency

') #

設定x軸和y軸的座標含義

箱型圖

#

以birthord作為x軸,agepreg作為y軸,做乙個箱型圖

多變數作圖

seaborn可以一次性兩兩組合多個變數做出多個對比圖,有n個變數,就會做出乙個n × n個格仔的圖,譬如有2個變數,就會產生4個格仔,每個格仔就是兩個變數之間的對比圖

var1  vs  var1

var1  vs  var2

var2  vs  var1

var2  vs  var2

相同的兩個變數之間(var1  vs  var1 和 var2  vs  var2)以直方圖展示,不同的變數則以散點圖展示(var1  vs  var2 和var2  vs  var1)

要注意的是資料中不能有nan(缺失的資料),否則會報錯

Python視覺化 Seaborn(三)

時間序列模型決定了 的準確性,良好的視覺化展示能為模型效果增益。seaborn因其高相容性和互動性,在時間序列資料視覺化設計中獨佔優勢。由美國國家 中心收集,記錄了全世界所有顯著 的地點和震級 自1965年報告的震級為5.5以上 的發生日期,時間,位置,深度,大小和 資料 import pandas...

Python資料視覺化 seaborn

seaborn其實是在matplotlib的基礎上進行了更高階的api封裝,從而使得作圖更加容易,在大多數情況下使用seaborn就能做出很具有吸引力的圖。這裡例項採用的資料集都是seaborn提供的幾個經典資料集,dataset檔案可見於github。set style 是用來設定主題的,seab...

python 資料視覺化 Seaborn

一 introduce seaborn是基於matplotlib的圖形視覺化python包,在matplotlib的基礎上進行了更高階的api封裝,從而使得作圖更加容易,在大多數情況下使用seaborn能做出很具有吸引力的圖,而使用matplotlib就能製作具有更多特色的圖。應該把seaborn視...