用Python讀紅樓夢之 二 詞云美化

2021-07-14 13:57:00 字數 1316 閱讀 7503

原文連線

咱們書接上回,講到我們使用python把紅樓夢中的核心詞彙給繪畫出來了,但是,紅樓夢這麼唯美的書,給我們烏漆麻黑的搞了一張詞云,寶寶們肯定接受不了。

我們先來找**,這張**不錯,不過還是要處理一下,把背景處理稱為白色,這個時候,ps工具可以簡單地達到這個效果。

接著,我們就要來寫程式了,老規矩,我們先來匯入包:

from scipy.misc import imread

import matplotlib.pyplot as plt

from wordcloud import wordcloud, imagecolorgenerator

把讀取進去,然後重新設定一下wordcloud物件,設定mask為我們的。

bimg = imread("d:\\賈寶玉.png")

wordcloud = wordcloud(

background_color="white", 

mask=bimg, font_path='d:\\simhei.ttf'

)接著,我們就可以美美地繪製詞云了。

wordcloud = wordcloud.fit_words(segstat.head(1000).itertuples(index=false))

bimgcolors = imagecolorgenerator(bimg)

plt.axis("off")

plt.imshow(wordcloud.recolor(color_func=bimgcolors))

plt.show()

長腿歐巴雖然好,但是畫起來,很明顯我們的詞彙分成兩大部分了,這樣子會分散我們的注意力,因此,我們使用人物作為背景繪製詞云的時候,最好只是使用上半身,使用頭像就更好了。因此,長腿歐巴拜拜。

bimg = imread("d:\\賈寶玉2.png")

wordcloud = wordcloud(

background_color="white", 

mask=bimg, font_path='d:\\simhei.ttf'

)wordcloud = wordcloud.fit_words(segstat.head(1000).itertuples(index=false))

bimgcolors = imagecolorgenerator(bimg)

plt.axis("off")

plt.imshow(wordcloud.recolor(color_func=bimgcolors))

plt.show()

這樣子畫出來的詞云,是不是就唯美了很多了呢?希望你們喜歡,欲知後事如何,歡迎微博關注@大資料分析實戰,我們下回再見。

紅樓夢詞云製作(帶背景)

初學望批評指正。紅樓詞云帶背景圖的那種。原始影象 最終用ps合成的圖。其實挺唏噓的,一般人認為黛玉是絕對的女主,但是黛玉只出現了900多次,不及賈母3000次 鳳姐的1000次。這個是人物出場次數統計 這個是我的另乙個帖子,紅樓夢人物出場統計 最終的成片。摳圖畢竟簡陋。源 如下 elif word ...

python 統計紅樓夢人員姓名出現次數

使用到jieba庫 python 第三方中文分詞庫 1 安裝jieba庫 2 紅樓夢 txt 文件 import jieba txt open 紅樓夢.txt r encoding utf 8 read wenben jieba.lcut txt 使用精確模式對文字進行分詞 counts 通過鍵值對...

PYTHON中JIEBA分詞關於紅樓夢出現的高頻詞

import jieba excludes txt open 紅樓夢.txt r encoding utf 8 read words jieba.lcut txt 利用jieba庫將紅樓夢的所有語句分成詞彙 counts 建立的乙個空的字典 for word in words if len word...