python之wordcloud庫的使用

2021-10-01 04:04:02 字數 2461 閱讀 7003

wordcloud是優秀的詞云展示第三方庫,需要用pip安裝,它可以根據文字中詞語出現的頻率等引數繪製詞云,而且詞云的繪製形狀、尺寸和顏色都可以設定。

wordcloud.wordcloud()代表乙個文字對應的詞云。

首先指定物件:w = wordcloud.wordcloud() #注意大小寫一定要正確

其中括號中可以填引數進行設定

引數描述

width

指定詞云物件生成的寬度,預設400畫素 >>>w=wordcloud.wordcloud(width=600)

height

指定詞云物件生成的高度,預設200畫素 >>>w=wordcloud.wordcloud(height=400)

min_font_size

指定詞雲中字型的最小字型大小,預設4號 >>>w=wordcloud.wordcloud(min_font_size=10)

max_font_size

指定詞雲中字型的最大字型大小,根據高度自動調節 >>>w=wordcloud.wordcloud(max_font_size=20)

font_step

指定詞雲中字型字型大小的步進間隔,預設為1 >>>w=wordcloud.wordcloud(font_step=2)

font_path

指定字型檔案的路徑,預設none >>>w=wordcloud.wordcloud(font_path=「msyh.ttc」)

max_words

指定詞云顯示的最大單詞數量,預設200 >>>w=wordcloud.wordcloud(max_words=20)

stop_words

指定詞云的排除詞列表,即不顯示的單詞列表 >>>w=wordcloud.wordcloud(stop_words=)

mask

指定詞云形狀,預設為長方形,需要引用imread()函式 >>>from scipy.misc import imread >>>mk=imread(「pic.png」) >>>w=wordcloud.wordcloud(mask=mk)

background_color

指定詞云的背景顏色,預設為黑色 >>>w=wordcloud.wordcloud(background_color=「white」)

具體使用方法還是簡單的,我大致分為三步。

1 指定物件

2 載入txt文字檔案

3 影象的輸出

方法描述

w.generate(txt)

向wordcloud物件w中載入文字txt >>>w.generate(「python and wordcloud」)

w.to_file(filename)

將詞云輸出為影象檔案,.png或.jpg格式 >>>w.to_file(「outfile.png」)

當然這只是總的步驟,中間還有許多的引數需要設定。英文的要簡單點,因為每個單詞都有空格可以區分。那麼中文就需要匯入jieba庫進行分詞後才能統計。jieba庫使用傳送門——>jieba庫使用

先來個英文的,上**(效果我現在沒法弄出來,因為我的這個wordcloud打死安裝不下來,真是奇了怪了。。

現在我解決了這個問題了,各位參考我寫的三方庫安裝問題解決——>python第三方庫的安裝

注意:為了避免你們再次掉坑,py檔名不能用wordcloud,否則存在wordcloud導不進去的情況!!!)

import wordcloud

txt = "life is short, you need python"

w = wordcloud.wordcloud( \

background_color = "white")

w.generate(txt)

w.to_file("picture/pywcloud.png")

效果如圖

再來個中文的,上菜。

import jieba

import wordcloud

f = open("word frequency/threekingdoms.txt", "r", encoding="utf-8")

t = f.read()

f.close()

ls = jieba.lcut(t)

txt = " ".join(ls)

w = wordcloud.wordcloud( \

width = 1000, height = 700,\

background_color = "white",

font_path = "msyh.ttc"

)w.generate(txt)

w.to_file("picture/grwordcloud.png")

效果如圖

python之異常處理 Python之異常處理

異常物件 請大家執行如下 a 100 0 print a 就會發現直譯器顯示如下的錯誤提示 traceback most recent call last file x.py line 1,in a 100 0 zerodivisionerror division by zero 大家要學會看直譯器...

python基礎之語句 Python基礎之條件語句

我們在程式設計中經常需要通過檢查某個條件,從而決定去做什麼。條件語句就是針對這一情景應用的。本篇主要介紹 if 和 while。一 if語句 先來個總覽 if 條件一 條件一對應的 塊 elif 條件二 條件一對應的 塊 else 不滿足條件一和條件二對應的 塊 if 語句的核心就是值為true 或...

python之路之python爬蟲

一.將鏈結url原始碼讀出,將其作為列表輸出 二.使用正規表示式將原始碼中有關的原始碼篩選出來,jpg檔案 三.在輸出的過程中按照自己的方式命名 這裡邊唯一的難點恐怕是正規表示式的書寫,下面我們初步系統的講解一下正規表示式 前面有一講專門介紹了正規表示式 具體可以檢視鏈結,這裡只進行一些重要的補充。...