製作詞云 wordcloud 引數配置

2021-10-09 05:46:25 字數 1941 閱讀 8319

font_path : string  #字型路徑,需要展現什麼字型就把該字型路徑+字尾名寫上,如:font_path = '黑體.ttf'

width : int (default=400) #輸出的畫布寬度,預設為400畫素

height : int (default=200) #輸出的畫布高度,預設為200畫素

prefer_horizontal : float (default=0.90) #詞語水平方向排版出現的頻率,預設 0.9 (所以詞語垂直方向排版出現頻率為 0.1 )

mask : nd-array or none (default=none) #如果引數為空,則使用二維遮罩繪製詞云。如果 mask 非空,設定的寬高值將被忽略,遮罩形狀被 mask 取代。除全白(#ffffff)的部分將不會繪製,其餘部分會用於繪製詞云。如:bg_pic = imread('讀取一張.png'),背景的畫布一定要設定為白色(#ffffff),然後顯示的形狀為不是白色的其他顏色。可以用ps工具將自己要顯示的形狀複製到乙個純白色的畫布上再儲存,就ok了。

scale : float (default=1) #按照比例進行放大畫布,如設定為1.5,則長和寬都是原來畫布的1.5倍

min_font_size : int (default=4) #顯示的最小的字型大小

font_step : int (default=1) #字型步長,如果步長大於1,會加快運算但是可能導致結果出現較大的誤差

max_words : number (default=200) #要顯示的詞的最大個數

stopwords : set of strings or none #設定需要遮蔽的詞,如果為空,則使用內建的stopwords

background_color : color value (default=」black」) #背景顏色,如background_color='white',背景顏色為白色

max_font_size : int or none (default=none) #顯示的最大的字型大小

mode : string (default=」rgb」) #當引數為「rgba」並且background_color不為空時,背景為透明

relative_scaling : float (default=.5) #詞頻和字型大小的關聯性

color_func : callable, default=none #生成新顏色的函式,如果為空,則使用 self.color_func

regexp : string or none (optional) #使用正規表示式分隔輸入的文字

collocations : bool, default=true #是否包括兩個詞的搭配

colormap : string or matplotlib colormap, default=」viridis」 #給每個單詞隨機分配顏色,若指定color_func,則忽略該方法

random_state : int or none #為每個單詞返回乙個pil顏色

fit_words(frequencies)  #根據詞頻生成詞云

generate(text) #根據文字生成詞云

generate_from_frequencies(frequencies[, ...]) #根據詞頻生成詞云

generate_from_text(text) #根據文字生成詞云

process_text(text) #將長文字分詞並去除遮蔽詞(此處指英語,中文分詞還是需要自己用別的庫先行實現,使用上面的 fit_words(frequencies) )

recolor([random_state, color_func, colormap]) #對現有輸出重新著色。重新上色會比重新生成整個詞云快很多

to_array() #轉化為 numpy array

to_file(filename) #輸出到檔案

用python製作詞云

注意 pil安裝需要使用 pip install pillow 命令1.首先需要把文字中的詞語先分割出來 使用jieba.cut 方法可以將一段文字中的中文詞條切割2.選擇一張作為詞云的背景 要求輪廓清晰 使用numpy.array 方法把轉化成陣列形式,為最終生成詞云做鋪墊3.將統計好的詞按照頻率...

Python 利用wordloud製作詞云

本文首發於我的部落格 gongyanli.com 詞云github 前言 第一次使用wordcloud,然後記錄了自己的點滴,使用其實很簡單。我輸出的圖形看著不太美觀,後續可以深入研究,輸出自己想要的形狀。pip install wordcloud from wordcloud import wor...

乾貨收藏 python製作詞云

import matplotlib.pyplot as plt import jieba from wordcloud import wordcloud 1.讀入txt文字資料 text open r test.txt r read print text 2.結巴中文分詞,生成字串,預設精確模式,如...