中文分詞器ikanalyzer 簡單使用

2021-09-24 10:17:03 字數 574 閱讀 3659

依賴

com.janeluo

ikanalyzer

2012_u6

測試:

/**

* 測試ikanalyzer中文分詞器

*/public class iktest

}}

結果:

李|天一|現名|李|冠|豐|著名|歌唱家|李|雙江|和|知名|歌唱家|夢|鴿|之子|根據|司法機關|公布|資料|顯示|李|天一|出生於|2023年|4月|曾|就讀|北京|海淀區|中關村|第三|小學|人民大學|附中|美國|shattuck-st.|mary|s|school|沙特|克|聖瑪麗|學院|冰球|學校|2023年|9月|6日|因|與人|鬥毆|被|拘留|教養|1年|2023年|9月|19日|李|天|一被|解除|教養|2023年|2月|22日|因涉嫌|**案|被|刑事拘留|後|因|可查|資料|顯示|未成年|移交|少管所|3月|7日|**電視台|新聞中心|官方|微|博|發布|了|一條|訊息|稱|李|天一|因涉嫌|**罪|已被|檢察機關|批捕|2023年|9月|李|雙江|一篇|舊|文|證實|李|天一|成年|

Solr 新增 IKAnalyzer分詞器

3.在 solr new core conf managed schema 增加如下配置 name text ik class solr.textfield type index ismaxwordlength false class org.wltea.analyzer.lucene.ikanal...

發布IKAnalyzer中文分詞器V3 1 6GA

color red ikanalyzer3.2.0穩定版已經發布,支援lucene3.0和solr1.4 color b size large v3.1.1ga v3.1.5ga 版本變更一覽 size b list 1.新增 正向最大切分演算法 2.完善ik analyzer對solr1.3版本的...

IKAnalyzer 自定義分詞器

lucene 全文搜尋框架,具體的定義在這裡就不過多的介紹。那麼主要講一下,利用第三方分詞器自定義我們的分成規則,ikanalyzer 庖丁分詞器就是乙個很好的中文分詞器。首先匯入對應的jar包,我們都很清楚,配置檔案是一種有效擴充套件的一種方式,那麼ikanalyzer也不例外。1.首先建立乙個專...