大資料視覺化(四)比例資料視覺化

2021-10-12 02:45:42 字數 2638 閱讀 5973

比例資料根據類別、子類別、群體進行劃分。

可以呈現各個部分與其他部分的相對關係,還可以呈現整體的構成情況

不太適合表示精確的資料

適合呈現各部分在整體中的比例,體現部分與整體之間的關係

data=pd.read_csv("data/vote_result.csv")

datab=data["areas_of_interest"].values.tolist()

data_num=data["votes"].values.tolist()

print(data.values.tolist())

pie=(

pie()

.add("感興趣的領域",data.values.tolist(),radius=[80,150])#center=[水平,垂直]移**形位置 radius=[內徑,外徑]設定空心

.set_global_opts(title_opts=opts.titleopts(title="使用者感興趣的領域",#標題

subtitle="以下是讀者投票結果",#副標題

pos_left="center"),

legend_opts=opts.legendopts(#is_show=false,#去掉圖例

pos_left=0,

orient="vertical",#圖例垂直),)

.set_series_opts(label_opts=opts.labelopts(is_show=false,#是否顯示標籤

),#)

.render("result/bing.html")

)

呈現比例資料 

x=data["issue"].values.tolist()

y3=data["none"].values.tolist()

print(y1)

bar=(

bar()

.add_xaxis(x)

.add_yaxis("none",y3,stack=true)

.set_global_opts(title_opts=opts.titleopts("1","2"),

xaxis_opts=opts.axisopts(

axislabel_opts=opts.labelopts(rotate=30,font_size=9)),#設定大小與傾斜度

).set_series_opts(label_opts=opts.labelopts(is_show=false))

.render("result/4-11.html")

)樹圖主要用於對樹形資料進行視覺化,層次結構,只能展示資料之間的層次關係

矩形樹圖是基於面積的視覺化。外部矩形代表父,裡面代表子型別。可以展示資料之間的層級關係,也可以通過面積的大小來展示各個類別之間的比例關係。

可以很好的呈現比例資料隨時間的變化情況

可以看到整體的變化趨勢,也能看到其中每一類的變化情況

data=pd.read_excel("data/us-population-by-age.xls")

print(datax)

y1=data["under 5"].values.tolist()

y2=data["5 to 19"].values.tolist()

y3=data["20 to 44"].values.tolist()

y4=data["45 to 64"].values.tolist()

y5=data["65+"].values.tolist()

line=(

line(init_opts=opts.initopts(width="500px",height="500px")# 設定背景布大小

).add_xaxis(datax)

.add_yaxis("under 5",y1,stack=true,is_smooth=true,areastyle_opts=opts.areastyleopts(opacity=0.5,color="red"))#stack是否堆疊is_smooth是否平滑,areastyle_opts區域設定

.add_yaxis("5 to 19",y2,stack=true,is_smooth=true,areastyle_opts=opts.areastyleopts(opacity=0.5,color="blue"))

.add_yaxis("20 to 44",y3,stack=true,is_smooth=true,areastyle_opts=opts.areastyleopts(opacity=0.5,color="green"))

.add_yaxis("45 to 64",y4,stack=true,is_smooth=true,areastyle_opts=opts.areastyleopts(opacity=0.5,color="yellow"))

.add_yaxis("65+",y5,stack=true,is_smooth=true,areastyle_opts=opts.areastyleopts(opacity=0.5,color="orange"))

.set_series_opts(label_opts=opts.labelopts(is_show=false))#不顯示標籤

.render("result/4-21.html")

)

資料視覺化 什麼是資料視覺化

資料對應的英文單詞是data,從資訊獲取的角度看,資料是對目標觀察和記錄的結果,是現實世界中的時間 地點 事件 其他物件或概念的描述。不同學者對資料的作用也給出不同的定義,大致分為以下3類 視覺化對應的兩個英文單詞 visualize和visualization。visualize是動詞,描述 生成...

大資料視覺化(五)關係資料視覺化

關係資料具有關聯性與分布性 兩個量化資料之間的數理關係 通過資料關聯性可已根據乙個已知的數值變化來 另乙個數值的變化。正相關 負相關 不相關 散點圖 crime pd.read csv data crimeratesbystate2005.csv scatter add xaxis crime mu...

大資料視覺化(六)文字資料視覺化

在於利用視覺化技術刻畫文字和文件,將其中的資訊直觀的呈現。對文字的理解需求分為 詞彙級 語法級和語義級。詞彙級使用各類分詞演算法,而語法級使用一些句法分析演算法,語義級則使用主題抽取演算法。文字資料類別分為 單文字,文件集合,時序文字。文字視覺化的基本流程 原始文字 文字資訊挖掘 文字預處理 文字特...