jieba wordcloud 按詞頻生成詞云

2021-10-03 21:10:45 字數 1665 閱讀 7850

# -*- coding: utf-8 -*-

from random import randint

import jieba.analyse

from os import path

from pil import image,imagesequence

import numpy as np

import matplotlib.pyplot as plt

from wordcloud import wordcloud, stopwords, imagecolorgenerator

d = path.dirname(__file__)

mypath = '你的檔案路徑'

file_in = open(path, 'r')

content = file_in.read()

try:

#jieba.analyse.set_stop_words('你的停用詞表路徑')

tags = jieba.analyse.extract_tags(content, topk=100, withweight=true)

keywords = dict()

for v, n in tags:

#權重是小數,為了湊整,乘了一萬

keywords[v] = (int(n * 10000))

print(keywords)

finally:

file_in.close()

pic_address=path.abspath(mypath+"武漢區劃.jpg")

pic= plt.imread(pic_address) #讀取

def random_color_func(word=none, font_size=none, position=none, orientation=none, font_path=none, random_state=none):

h = randint(120, 250)

s = int(100.0 * 255.0 / 255.0)

l = int(100.0 * float(randint(60, 120)) / 255.0)

return "hsl({}, {}%, {}%)".format(h, s, l)

wc=wordcloud(background_color='white', #構造wordcloud類

mask=pic,

max_font_size=50,

mode="rgb",

scale=10,

font_path=mypath+"msyhbd.ttf",

max_words=100,

min_font_size=10,

color_func = random_color_func,

random_state="none",

)#random_state:如果給定乙個隨機的物件,會用作它生成隨機種子的數字

wc.generate_from_frequencies(keywords)

plt.figure() #畫圖

plt.imshow(wc)

plt.axis("off")

plt.show()

wc.to_file(mypath+"1.png") #儲存

按位AND和按位OR

description 已知長度為n的兩個位串a和b,求它們的按位and和按位or。input 多組測試資料,每組測試資料第1行輸入位串長度n 0 n 64 第2行輸入n個以空格隔開的取值為0或1的整數表示位串a,第3行輸入n個以空格隔開的取值為0或1的整數表示位串b。output 每組測試資料佔兩...

形參,實參,按值,按引用,按指標

形參 全稱為 形式引數 是在定義函式名和函式體的時候使用的引數,目的是用來接收呼叫該函式時傳如的引數.實參 全稱為 實際引數 是在呼叫時傳遞個該函式的引數.形參和實參的型別必須要一致,或者要符合隱含轉換規則,當形參和實參不是指標型別時,在該函式執行時,形參和實 參是不同的變數,他們在記憶體中位於不同...

mysql 按小時,按天,按周等 統計

按周 select date format create time,y u weeks,count caseid count from tc case group by weeks 按月select date format create time,y m months,count caseid co...