Python中WordCloud各引數的含義

2021-08-20 09:55:20 字數 1973 閱讀 3829

用python畫詞云時,需要用到wordcloud,下面羅列了它各個引數的含義:

font_path : string  #字型路徑,需要展現什麼字型就把該字型路徑+字尾名寫上,如:font_path = '黑體.ttf'

width : int (default=400) #輸出的畫布寬度,預設為400畫素

height : int (default=200) #輸出的畫布高度,預設為200畫素

prefer_horizontal : float (default=0.90) #詞語水平方向排版出現的頻率,預設 0.9 (所以詞語垂直方向排版出現頻率為 0.1 )

mask : nd-array or none (default=none) #如果引數為空,則使用二維遮罩繪製詞云。如果 mask 非空,設定的寬高值將被忽略,遮罩形狀被 mask 取代。除全白(#ffffff)的部分將不會繪製,其餘部分會用於繪製詞云。如:bg_pic = imread('讀取一張.png'),背景的畫布一定要設定為白色(#ffffff),然後顯示的形狀為不是白色的其他顏色。可以用ps工具將自己要顯示的形狀複製到乙個純白色的畫布上再儲存,就ok了。

scale : float (default=1) #按照比例進行放大畫布,如設定為1.5,則長和寬都是原來畫布的1.5倍

min_font_size : int (default=4) #顯示的最小的字型大小

font_step : int (default=1) #字型步長,如果步長大於1,會加快運算但是可能導致結果出現較大的誤差

max_words : number (default=200) #要顯示的詞的最大個數

stopwords : set of strings or none #設定需要遮蔽的詞,如果為空,則使用內建的stopwords

background_color : color value (default=」black」) #背景顏色,如background_color='white',背景顏色為白色

max_font_size : int or none (default=none) #顯示的最大的字型大小

mode : string (default=」rgb」) #當引數為「rgba」並且background_color不為空時,背景為透明

relative_scaling : float (default=.5) #詞頻和字型大小的關聯性

color_func : callable, default=none #生成新顏色的函式,如果為空,則使用 self.color_func

regexp : string or none (optional) #使用正規表示式分隔輸入的文字

collocations : bool, default=true #是否包括兩個詞的搭配

colormap : string or matplotlib colormap, default=」viridis」 #給每個單詞隨機分配顏色,若指定color_func,則忽略該方法

random_state : int or none #為每個單詞返回乙個pil顏色

fit_words(frequencies) #根據詞頻生成詞云

generate(text) #根據文字生成詞云

generate_from_frequencies(frequencies[, ...]) #根據詞頻生成詞云

generate_from_text(text) #根據文字生成詞云

process_text(text) #將長文字分詞並去除遮蔽詞(此處指英語,中文分詞還是需要自己用別的庫先行實現,使用上面的 fit_words(frequencies) )

recolor([random_state, color_func, colormap]) #對現有輸出重新著色。重新上色會比重新生成整個詞云快很多

to_array() #轉化為 numpy array

to_file(filename) #輸出到檔案

python中 python中的 與

這一部分首先要理解python記憶體機制,python中萬物皆物件。對於不可變物件,改變了原來的值,其別名 變數名 繫結到了新值上面,id肯定會改變 對於可變物件,操作改變了值,id肯定會變,而 是本地操作,其值原地修改 對於 號操作,可變物件和不可變物件呼叫的都是 add 操作 對於 號操作,可變...

python中否定for 在python中否定函式

有沒有一種方法可以否定乙個函式,使它返回負數。在我的函式中,我有條件句,每個條件句都讓這個 烏龜 移動。有沒有一種方法可以否定這一點,所以烏龜的每乙個動作都是否定的。我說的是 狀況 在def ttinterpret program interpret program as a tinyturtle ...

python中雙重迴圈 加速Python中的雙迴圈

有沒有辦法加快從上一次迭代更新其值的雙迴圈?在 中 def calc n,m x 1.0 y 2.0 container np.zeros n,2 for i in range n for j in range m x np.random.gamma 3,1.0 y y 4 y np.random....