python實訓筆記(詞云的製作)

2021-10-08 17:48:47 字數 2037 閱讀 6835

首先需要進行對資訊進行爬取,然後將爬取內容放在txt檔案中利用jieba模板進行文書處理,再用處理過的文字資料進行詞云繪製

import jieba

defcut_data()

:with

open

("comment.txt"

,"r"

,encoding=

"utf-8"

)as f:

data=f.read(

)#讀取資料

cut_text=

" ".join(jieba.cut(data)

)#用空格分隔兩個分詞的的詞語

with

open

("data.txt"

,"a"

,encoding=

"utf-8"

)as f:

f.write(cut_text)

cut_data(

)

from wordcloud import wordcloud,stopwords,imagecolorgenerator

import matplotlib.pylab as plt

import codecs

from imageio import imread

import os

class

get_wordcloud

:def

__init__

(self)

:#存放字型路徑、分詞之後的資料路徑、路徑

:#處理資料型別和文字資料型別的函式

d=os.path.dirname(__file__)

#獲取當前檔案的操作路徑

image=imread(self.image_path)

#將轉換為多維陣列

text=codecs.

open

(os.path.join(d,self.data_path)

,"rb"

,encoding=

"utf-8"

).read(

)#用二進位制的方法讀取分詞資料

self.draw_wordcloud(image,text)

defdraw_wordcloud

(self,image,text)

:#繪製詞云的函式

stopwords=

set(stopwords)

#使用預設的遮蔽詞彙

#傳入生成詞云的引數 字型位置 陣列 遮蔽字 背景顏色 最大詞數 字型最大限制

wordcloud=wordcloud(font_path=self.font_path,mask=image,stopwords=stopwords,

background_color=

"white"

,max_words=

1000

,max_font_size=

200)

.generate(text)

image_color=imagecolorgenerator(image)

#讓生成詞云的字型顏色隨著的顏色變化

)#設定詞云名稱

plt.imshow(wordcloud.recolor(color_func=image_color)

)#生成詞云時的顏色

plt.axis(

"off"

)#不顯示座標軸

plt.show(

)#生成詞云

get_word=get_wordcloud(

)get_word.get_info(

)

python 詞云製作

製作詞云需要兩個python核心類庫 準備乙個text文件,上面寫上要做的文字,以及一張作詞雲的背景圖 coding utf 8 import pil from os import path from pil import image import numpy as np import matplo...

Python生成詞云的製作

現成的詞云製作工具也很多 1.wordle是乙個用於從文字生成詞雲圖而提供的遊戲工具.3.tagul是乙個web服務,同樣可以建立華麗的詞云.4.tagcrowd還可以輸入web的url,直接生成某個網頁的詞云.詞云的本質是對文字中的詞進行詞云統計,根據出現頻率的多少來按比例展示大小.1.對文字資料...

實訓python的日記 python實訓第一天

實訓第一天總結 常量 常量也是變數,在python中大家都規定只要是大寫的變數都稱之為常量 使用者與程式互動 數字型別 整型int 浮點型float 字串型別 列表型別 字典型別 在 內,都逗號隔開,可存放多個值,每個值以key value的形式儲存 存 dict1 取 print dict1 na...