使用Scala進行wordcount

2021-10-25 00:20:41 字數 494 閱讀 6475

1.定義陣列: val stringlist = list(「hello aythna hello kirito」,「hello liliya hello luluxiu」,「hello nana hello sandy」)

2.壓縮陣列(呼叫flatmap方法),按空格來分割:stringlist.flatmap (x => x.split(" "))

3.將分割好的陣列用map方法處理:stringlist.flatmap (x => x.split(" ")).map(x => (x,1))

4.將該map用陣列中的key進行分組:stringlist.flatmap (x => x.split(" ")).map(x => (x,1)).groupby(x => x._1)

5.用map方法進行統計:stringlist.flatmap (x => x.split(" ")).map(x => (x,1)).groupby(x => x._1).map(x => (x._1,x._2.size))

scala 符號的使用

一 匿名函式,左邊是引數 右邊是函式實現體 val list list 1,2,3 map println list 二 函式型別的宣告,左邊是引數型別,右邊是方法返回值型別 val g int string myint val h unit 三 指定引數為call by name by name ...

Scala使用Ansj分詞

org.ansj ansj seg 5.1.6 org.nlpcn nlp lang 1.7.7 ansj分詞有四種模式 使用者自定義詞典 數字識別 人名識別 機構名識別 新詞發現 使用者自定義詞典 數字識別 人名識別 機構名識別 新詞發現 使用者自定義詞典 數字識別 人名識別 機構名識別 新詞發現...

Scala系列21 Scala提取器的使用

我們之前已經使用過scala中非常強大的模式匹配功能了,通過模式匹配,我們可以快速匹配樣例類中的成員變數。例如 1.建立兩個樣例類 case class person name string,age int case class order id string def main args array...