新技能 get 使用 python 生成詞云

2021-07-29 05:29:09 字數 971 閱讀 3190

從技術上來看,詞云是一種有趣的資料視覺化方法,網際網路上有很多的現成的工具:

#coding: utf-8

import jieba

from wordcloud import wordcloud

import matplotlib.pyplot as plt

text_from_file = open('檔案.txt', 'rb').read()

wordlist = jieba.cut(text_from_file, cut_all=true) # 首先使用 jieba 中文分詞工具進行分詞

wordlist_space_split = ' '.join(wordlist)

my_wordcloud = wordcloud().generate(wordlist_space_split)

plt.imshow(my_wordcloud) # 以的形式顯示詞云

plt.axis('off') # 關閉座標軸

plt.show()

剛開始執行這十行**的時候,只顯式了若干彩色的小矩形框,中文詞語顯式不出來,以為是萬惡的 utf8 問題,debug一下,發現 print 結巴分詞的結果是可以顯示中文的,那就是 wordcloud 生成詞語的字型庫問題了。開源的好處來了,直接進入wordcloud.py 的原始碼,找字型庫相關的**:

font_path = os.environ

.get("font_path", os.path

.join(os.path

.dirname(__file__), "droidsansmono.ttf"))

wordcloud 預設使用了droidsansmono.ttf 字型庫,改一下換成乙個支援中文的ttf 字型檔(比如simsun.ttc,常規-宋體), 重新執行一下這十行**,就可以了。

暴力搜尋 新技能get

最近新學習了一種新的求解的方法,就是暴力搜尋,在通常做題沒有很明確的思路的時候,通常都會採用的一種方式。我們知道,乙個問題的解空間通常對應的是一棵樹的方式進行組織的,那麼我們可以通過根據題目中的條件描述來掃瞄 樹中的每乙個結點,對應的就是將問題的所有可能的解進行掃瞄一遍,從中選出滿足要求的即為問題的...

看小說新技能Get 爬蟲練習

想看 但是 的廣告又層出不窮,點一頁出來乙個廣告,攔截廣告的操作我又不是很熟練,那就把 資源移動到沒有廣告的地方吧 我不寫 但我是 的搬運工。搬運第一步,瞄準 開啟f12,看看內容在 nice 竟然光明正大的放在這兒,那就別怪我搬運了 魔鬼臉,嘿嘿 要搬就得全部搬走,先把每一章的 給他搬過來。上搬運...

新技能get 在任意目錄執行NDK編譯

準備環境 首先,你得安裝了android的ndk編譯工具,假設你的ndk的根目錄在 opt android ndk 當然,最好你能在環境變數裡配置一下路徑,否則使用ndk build命令的時候,都得加上路徑的字首了。修改 bashrc export ndk home opt android ndk ...