python 資料視覺化 詞云

2021-10-03 16:01:15 字數 1968 閱讀 3563

近年來,大資料等一系列字眼開始進入到普通老百姓的生活中,但大部分老百姓對其知之甚少。人們通常了解大資料主要是通過資料視覺化,而詞云作為資料視覺化中較為直觀、強烈的視覺衝擊,也越來越受到人們的重視。

廢話不多說,先給大家展示一下效果。

**展示:

import xlrd

import jieba

import matplotlib.pylab as plt

from wordcloud import wordcloud

from collections import counter

def getexceldata(excel,txt):

readbook = xlrd.open_workbook(excel)

sheet = readbook.sheet_by_index(1) #取第二個sheet頁

rows = sheet.nrows

i = 0

while i < rows:

txt += sheet.cell(i, 7).value #取第三列的值

i += 1

seg_list = jieba.cut(txt)

c = counter()

result = {}

for x in seg_list:

if len(x) > 1 and x != '\r\n':

c[x] += 1

for (k, v) in c.most_common():

result[k] = v #放到字典中,用於生成詞云的源資料

return result

def makewordcloud(txt):

x, y = np.ogrid[:300, :500]

mask = (x - 150) ** 2 + (y - 150) ** 2 > 150 ** 2

mask = 255 * mask.astype(int)

#此處可以設定詞云的形態

wc = wordcloud(background_color="white",

max_words=500,

mask=mask,

repeat=true,

width=1000,

height=1000,

scale=4, #這個數值越大,產生的解析度越高,字跡越清晰

font_path="c:/windows/fonts/simfang.ttf")

wc.generate_from_frequencies(txt)

wc.to_file('abc.png')

plt.axis("off")

plt.imshow(wc, interpolation="bilinear")

plt.show()

if __name__ == '__main__':

txt = ''

makewordcloud(getexceldata('銷量.xlsx', txt))

詞雲圖:

我們還可以選擇任意的形狀,比如用著張作為形狀。

還有字型和顏色,這些都是可以修改的喔,在這裡就不一一介紹。

如果文章對您有幫助,麻煩點讚支援一下,謝謝啦!

視覺化文字資料 詞云

在r語言的包裡面,有乙個wordcloud的包,專門用來建立這種型別的圖形,它是由加州大學洛杉磯分校的專業統計學家ian fellows編寫的。下面用幾句簡單的r語言即可繪製出一張詞云 library wordcloud library tm library nlp getwd sms corpus...

R語言資料視覺化詞云繪製

jiebar,jiebard 分詞 wordcloud2 繪製詞云 installpackage jiebar jiebard wordcloud2 安裝程式包library jiebar,jiebard a需要將對研究無意義的詞去除,再次只提供了示例 stopwords class stopwor...

大資料視覺化案例一 詞云

詞云 詞雲圖過濾掉大量的文字資訊,使瀏覽網頁者只要一眼掃過文字就可以領略文字的主旨。在之前通過爬蟲獲得新冠肺炎資料之後,使用詞云來直觀反映哪些地區的疫情較嚴重。字越大反映越嚴重 第一步 讀取excel資料 import openpyxl wb openpyxl.load workbook data....