中文詞頻統計及詞云製作

2022-08-20 13:33:11 字數 1481 閱讀 4567

1.中軟國際華南區技術總監曾老師還會來上兩次課,同學們希望曾老師講些什麼內容?(認真想一想回答)

a講一下python的實際應用

b直接教我們使用python做更厲害的大程式

c講一下python開發工程師要具備什麼資質

d大資料除了python還有什麼比較熱門

2.中文分詞

)使用jieba庫,進行中文詞頻統計,輸出top20的詞及出現次數。

)**排除一些無意義詞、合併同一詞。

)**使用wordcloud庫繪製乙個詞云。

import

jieba

txt = open('

且聽風吟.txt

',"r

",encoding='

utf-8

').read()

ex =

ls =

words =jieba.lcut(txt)

counts ={}

for word in

words:

if len(word) == 1:

continue

else

: counts[word] = counts.get(word,0)+1

for word in

ex:

del(counts[word])

items =list(counts.items())

items.sort(key = lambda x:x[1], reverse =true)

for i in range(20):

word , count =items[i]

print ("

".format(word,count))

結果:

使用wordcloud庫繪製乙個詞云

#

coding:utf-8

import

jieba

from wordcloud import

wordcloud

import

matplotlib.pyplot as plt

text =open("

且聽風吟.txt

",'r

').read()

wordlist = jieba.cut(text,cut_all=true)

wl_split = "/"

.join(wordlist)

mywc =wordcloud().generate(text)

plt.imshow(mywc)

plt.axis(

"off")

plt.show()

結果:

中文詞頻統計及詞云製作

中軟國際華南區技術總監曾老師還會來上兩次課,同學們希望曾老師講些什麼內容?認真想一想回答 python有什麼用,能應用在生活中的哪些方面 使用jieba庫,進行中文詞頻統計,輸出top20的詞及出現次數。劉姥姥二進榮國府賈母在大觀園擺宴把她作女清客取笑劉姥姥便以此逗賈母開心 word w list ...

中文詞頻統計與詞云生成

中文詞頻統計 追風箏的人 txt 2.從檔案讀取待分析文字。3.安裝並使用jieba進行中文分詞。pip install jieba import jieba jieba.lcut text 4.更新詞庫,加入所分析物件的專業詞彙。jieba.add word 天罡北斗陣 逐個新增 jieba.lo...

中文詞頻統計與詞云生成

中文詞頻統計 作業連線 2.從檔案讀取待分析文字。3.安裝並使用jieba進行中文分詞。pip install jieba import jieba jieba.lcut text 4.更新詞庫,加入所分析物件的專業詞彙。jieba.add word 天罡北斗陣 逐個新增 jieba.load us...