R語言文字雲神器wordcloud2包

2021-09-13 00:16:40 字數 2579 閱讀 5141

續上篇文章,總結下wordcloud2包,主要的函式包括wordcloud2()和letterword(),其中wordcloud2函式用於生成文字雲,而letterword能將詞云設定成文字形狀,接下來分別介紹這兩個函式。

wordcloud2(data, size = 1, minsize = 0, gridsize =  0,

fontfamily = 'segoe ui', fontweight = 'bold',

color = 'random-dark', backgroundcolor = "white",

minrotation = -pi/4, maxrotation = pi/4, shuffle = true,

rotateratio = 0.4, shape = 'circle', ellipticity = 0.65,

widgetsize = null, figpath = null, hoverfunction = null)

主要引數介紹:

(1) data: a data frame including word and freq in each column

(2) size:font size, default is 1. the larger size means the bigger word.

(3) fontfamily:字型,如"aril"

(4) fontweight:字型粗細,例如normal、bold、600

(5) color:字型色系,可以選"random-dark"或"random-light"

(6) backgroundcolor:color of the background.

(7) minrotation和maxrotation:文字旋轉角度的最小值和最大值

(8) rotateratio:字型旋轉比例,如果設定為1則全部的詞都會旋轉

(9) shape:詞云的形狀,可選的有:"circle"(圓形)、"star"(五角星)、"cardioid"(蘋果或心)、"diamond"(鑽石)、"********-forward"(三角形_平躺)、"********"(三角形_直立)、"pentagon"(五邊形)

(10) figpath:the path to a figure used as a mask.

lettercloud(data, word, wordsize = 0, letterfont = null, ...)
下面以包中自帶的資料集demofreqc為例介紹函式具體用法

library(wordcloud2)

wordcloud2(demofreqc,

size = 1,

shape = 'circle',

fontfamily = '微軟雅黑',

fontweight = "nornal",

rotateratio = 0.5,

color = "random-light",

backgroundcolor = 'snow')

wordcloud2(demofreqc, 

size = 1,

fontfamily = '微軟雅黑',

fontweight = "600",

rotateratio = 1,

color = "random-dark",

backgroundcolor = 'snow',

figpath = '/library/frameworks/r.framework/versions/3.5/resources/library/wordcloud2/examples/t.png'

)

生成詞云如下:

除了內建的形狀以及的自定義形狀外,還能利用lettercloud函式生成自定義的文字形狀,如畫出r形狀的詞云,可以一下**

lettercloud(demofreqc, "r", wordsize = 0.3)
效果如下:

若想生成中文,需要用letterfont指出具體用的哪種中文字型,這就需要在使用之前了解自己的電腦有哪些中文字型,mac可以在字型冊例檢視,如果未指明字型,中文會亂碼,所有的字都生成乙個類似「口」的方框。

lettercloud(demofreqc, "分析", wordsize = 0.3,letterfont = 'hei')
效果如下:

總結:wordcloud2的功能還是非常齊全的,能生成很多形狀的詞云,除了包裡自帶的集中shape形狀,還可以用生成任意形狀,以及lettercloud生成任意文字形狀。

R語言 文字挖掘應用 標籤雲

雖然總有人對比python與r的實用性,但是作為資料分析的目標而言,工具不是重點,目標需求才是首要關注點,所以,今天嘗試用r自帶的一系列工具包來完成對於文字內容的挖掘,並利用標籤雲展示詞頻關係。工具包 程式設計環境 r編譯直譯器 rstudio 介面簡潔,操作方便,整合大量實用功能 挖掘展示過程 大...

R語言讀取Excel的神器 openxlsx

作為非程式猿的各位同志們,可能最擅長的資料整理軟體或者統計軟體就是 嗯,沒有錯,它就是集萬千寵愛於一身的e x o。咳咳咳,好了。隆重推出我們的主角 excel 事實上,excel是個super強大的軟體。基本上用它已經能完成大量的統計分析了。for example 各類數理統計 線性規劃 ling...

R語言 文字分類 1

因專案需要,結合自身專業知識,故而接觸了r語言及一些常用分類器。記錄下自己這乙個多月的學習歷程。與起源於貝爾實驗室的s語言類似,r也是一種為統計計算和繪圖而生的語言和環境,它是一套開源的資料分析解決方案,由乙個龐大且活躍的全球性研究型社群維護。r是一門指令碼語言,在繪圖方面有著非常強的能力,它可以讓...