電影《戰狼》評論詞云分析

2021-10-05 12:22:02 字數 3199 閱讀 9128

匯入需要使用的第三方庫

3.統計電影的推薦情況

perfect_counts=(comments_data['推薦']=="力薦").value_counts()

perfect_counts

good_counts=(comments_data['推薦']=="推薦").value_counts()

good_counts

not_bad_counts=(comments_data['推薦']=="還行").value_counts()

not_bad_counts

bad_counts=(comments_data['推薦']=="較差").value_counts()

bad_counts

terrible_counts=(comments_data['推薦']=="很差").value_counts()

繪製電影推薦情況柱狀圖

bar=bar()

bar.add_xaxis(['力薦','推薦','還行','較差','很差'])

bar.add_yaxis('',[1779,1041,442,151,145])

bar.set_global_opts(

title_opts=opts.titleopts(

title="影片戰狼推薦情況",

subtitle="人數")

#獲得分詞後的列表

seg_list=list(jieba.cut(comments_str))

#利用str.len()篩選字串長度,選出大於1的字串

keywords_counts=pd.series(seg_list)

keywords_counts=keywords_counts[keywords_counts.str.len()>1]

print(keywords_counts)

keywords_counts=keywords_counts.value_counts()

print(keywords_counts)

#構建乙個過濾詞的列表

filter_words=['知道','電影','影片','怎麼','還有','這個','這部','有用','沒用','可以','影評','可能','顯示',

'這篇','有劇','全文','乙個','沒有','就是','覺得','一部','回應','但是','還是','劇情','我們',

'還是','不是','什麼','自己','看到','沒關係','真的','感覺','**','很多','你們','豆瓣','時候',

'喜歡','雖然','哪些','那些','這樣','因為','有點','這麼','有些','那麼','這種','主角','作為','非常',

'所以','出來','開始','故事','如果','不能','邏輯','確實','地方','應該','其實','一直','各種',

'首先','一樣','題材','這是','來說','他們','對於','不過','特別','比較','裡面','評分','評價',

'有人','今天','這些','只是','尷尬','問題','鏡頭','完全','一星','不要','光環','而且','不過',

'然後','需要','一點','感受','之前','看看','之後','場景','型別','只有','不會','甚至','大家','一下',

'上映','水下','希望','以及','出現','本來','本身','呵呵','整部']

keywords_counts=keywords_counts.astype(str)

#篩選包含過濾詞的分詞字串

6.繪製詞雲圖

python小白的第一次嘗試,**可以更加優化的地方,希望大家可以指出來,共同進步。

長城評論詞云分析

最近 長城 這部電影很火,爭議也很大,我根據豆瓣底部的點評來分析這部電影在觀眾眼中是怎樣的。此為長城短評鏈結。下面給出 library xml library rcurl library stringr library rwordseg library tm library wordcloud2 l...

評論內容 詞云

coding utf 8 from wordcloud import wordcloud import jieba import matplotlib.pyplot as plt from matplotlib.font manager import fontpropertiesfrom scipy...

python電影名稱詞云 python 詞云

1 寫詞云的思路 資料採集 分詞 生成詞云 2 用到的模組 wordcloud。如果沒有這個模組,cmd進入python所在目錄的scripts資料夾,通過pip安裝。pip install wordcloud。安裝出現以下錯誤 3 開始編碼 匯入模組 from wordcloud import w...