資料視覺化學習心得

2021-10-24 08:05:55 字數 1903 閱讀 1918

import pandas as pd

pd.plotting.register_matplotlib_converters(

)import matplotlib.pyplot as plt

%matplotlib inline

import seaborn as sns

print

("setup complete"

)

折線圖

柱狀圖

sns.barplot(x=flight_data.index, y=flight_data[

'nk'

])

熱度圖

sns.heatmap(data=flight_data, annot=

true

)

散點圖

sns.scatterplot(x=insurance_data[

'bmi'

], y=insurance_data[

'charges'

])

畫出多種散點圖

sns.scatterplot(x=insurance_data[

'bmi'

], y=insurance_data[

'charges'

], hue=insurance_data[

'smoker'

])

分簇的散點圖

sns.swarmplot(x=candy_data[

'chocolate'

],y=candy_data[

'winpercent'

])

一種資料點的線性回歸

sns.regplot(x=insurance_data[

'bmi'

], y=insurance_data[

'charges'

])

多種資料點的線性回歸

sns.lmplot(x=

"bmi"

, y=

"charges"

, hue=

"smoker"

, data=insurance_data)

選擇某列的元素作為行索引

ign_data = pd.read_csv(ign_filepath,index_col=

"platform"

)

給出最低分數的值的列的索引

worst_genre = d1[d1==d1.

min()]

.index

關於dataframe的合併

newa = pd.concat(

[newa,t]

,axis=1)

#當newa的行數很大時,pd.concat會很慢。

#如果t是一列的話,也就是說給newa新增一列,可以通過對newa新增的「time」這一列複製,速度很快,如下操作:

newa[

'time'

]= t

pandas對列求差分

#一階差分

hammer_data[

'time'

].diff(

1)

資料視覺化學習筆記(二)

視覺感知 1.視覺感知和視覺認知 視覺認知 格式塔 gestalt 原則 基本原則 格式塔原則描述了人在視覺上如何感知物件,是圖形和使用者介面設計的基本準則。簡單提煉法則 格式塔原則最基本的法則是簡單提煉法則。視覺感知 將視覺感知內容理解為常規的 簡單的 相連的 對稱的或有序的結構。整體 將事物理解...

Python視覺化學習筆記二

coding utf 8 from matplotlib.pyplot import import matplotlib.pyplot as plt def for example plot儲存資料集,多組資料展現多條線 plot 1,2,3,2,3,2,2,1 plot 4,3,2,1 1,2,3...

R視覺化學習筆記1 資料匯入

import data 匯入csv資料,header t則首行有列名,heater false 則首行無列名 x read.table d desktop sj.csv sep header t gdp x gdp g1 x g1 g2 x g2 g3 x g3 若無行名,進行行名定義 data r...