評論內容 詞云

2022-09-13 17:33:08 字數 1258 閱讀 4038

# coding=utf-8

from wordcloud import wordcloud

import jieba

import matplotlib.pyplot as plt

from matplotlib.font_manager import fontpropertiesfrom scipy.misc import imreaddef read_file():

with open('comment.txt', 'r', encoding='utf-8') as f:

text = f.read()

return text

def data_img():

# 結巴分詞

wordlist = jieba.cut(read_file(), cut_all=true)

wl = ' '.join(wordlist)

# print(wl)

# 詞云tb_pic = imread('00.png') # 返回的是 numpy.ndarray 也即 numpy 下的多維陣列物件;wc = wordcloud(

# 設定顏色

background_color='white',

# 設定最大顯示詞云數

max_words=500,mask=tb_pic, # 設定背景# 設定下字型

font_path='c:\windows\fonts\simsun.ttc',

height=1200,

width=1600,

# 字型最大值

max_font_size=100,

# 設定有多少種隨機生成狀態,即有多少種配色方案

random_state=50,

)myword = wc.generate(wl)

print(myword)

# 展示 詞云

plt.figure(figsize=(16, 9)) # 大小

plt.imshow(myword) # 函式負責對影象進行處理,並顯示其格式, 不會顯示

plt.axis('off') # 不顯示座標尺寸

長城評論詞云分析

最近 長城 這部電影很火,爭議也很大,我根據豆瓣底部的點評來分析這部電影在觀眾眼中是怎樣的。此為長城短評鏈結。下面給出 library xml library rcurl library stringr library rwordseg library tm library wordcloud2 l...

電影《戰狼》評論詞云分析

匯入需要使用的第三方庫 3.統計電影的推薦情況 perfect counts comments data 推薦 力薦 value counts perfect counts good counts comments data 推薦 推薦 value counts good counts not ba...

使用者評論,關鍵詞遮蔽

badword array 小黃 小白 小藍 array fill index,number,value 函式用給定的鍵值填充陣列。array fill 0,count badword 結果 array 0 1 2 array combine 函式通過合併兩個陣列來建立乙個新陣列,其中的乙個陣列元素...