wordcloud庫與視覺化詞云以及一些遇到的坑

2021-09-26 20:46:00 字數 1068 閱讀 6271

今天在學python的利用wordcloud庫製作一些簡單的視覺化詞云。下面梳理一下今天遇到的幾個坑:

坑一

import imageio

mask = imageio.imread('chinamask.png')

坑二

第二個就是出來的結果,上沒有漢字,都是各個顏色的方框,後來了解到是因為沒有設定中文字型

wordcloud = wordcloud( font_path='msyh.ttc').generate(newtxt)  #微軟雅黑字型(msyh.ttc)
坑三

如果遇到字跡不清楚的,可以在wordcloud裡設定引數scale=4,數字越大越清楚,要求電腦配置也就越高。可參考文章用python和wordcloud繪製詞云(內附讓字型清晰的秘笈)

附源**及效果:

```python

from wordcloud import wordcloud

import jieba

import imageio

mask = imageio.imread('chinamask.png')

f = open('shijiuda.txt','r',encoding='utf-8')

#f='''同學們可將感興趣的段落複製於此來製作詞云

#。'''

txt = f.read()

words=jieba.lcut(txt) #精確分詞

newtxt=''.join(words) #空格拼接

wordcloud = wordcloud(background_color='white',

font_path='msyh.ttc',

width=800,

height=600,

max_words=200,

max_font_size=80,

mask=mask,

).generate(newtxt)

wordcloud.to_file('china.png') #決定詞云形狀的

效果圖因涉及政治因素一直審核不通過就被刪了

python 資料視覺化 詞云

近年來,大資料等一系列字眼開始進入到普通老百姓的生活中,但大部分老百姓對其知之甚少。人們通常了解大資料主要是通過資料視覺化,而詞云作為資料視覺化中較為直觀 強烈的視覺衝擊,也越來越受到人們的重視。廢話不多說,先給大家展示一下效果。展示 import xlrd import jieba import ...

python 視覺化庫

在做titanic分析的過程中,看了一些大神的想法,發現在分析資料的過程中,許多大神會使用到seaborn,plotly這些庫,而我等小白僅僅知道matplotlib這個唯一的資料視覺化庫而已。上網查詢資料後整理如下 資料視覺化庫可以根據其應用場景來分為以下幾類 基礎的2d,3d圖繪製庫,互動資訊視...

視覺化文字資料 詞云

在r語言的包裡面,有乙個wordcloud的包,專門用來建立這種型別的圖形,它是由加州大學洛杉磯分校的專業統計學家ian fellows編寫的。下面用幾句簡單的r語言即可繪製出一張詞云 library wordcloud library tm library nlp getwd sms corpus...