solr4 0加入中文分詞IKanalry

2021-09-01 13:13:21 字數 421 閱讀 6989

1:solr4.0加入中文分詞:

在ik的自帶文件中有:

這裡特別的羅嗦幾句,在solr4.0發布以後,官方取消了basetokenize***ctory介面,而直接使用lucene analyzer標準介面。因此ik分詞器2012 ff版本也取消了org.wltea.analyzer.solr.iktokenize***ctory類。

2:首先在tomcat不是的solr目錄下lib中加入:

ikanalyzer2012ff_u1.jar包

3:然後再solr目錄c:\solr\collection1\conf下的schema.xml檔案中加入:

就可以了,在solr介面中analys選錯 type下的 text就可以分詞了

比如:2:解釋下,我在ik的jar包中的dir字典加入了 停用詞:

中潭露。

Solr4 0效能調優之快取配置

size medium solr配置檔案 solrconfig.xml 有三種快取分別是 filtercache,queryresultcache,documentcache但solr是在什麼時候,什麼情況下會用到這些快取呢,通過看solr的原始碼,下面對solr三種快取做說明 list 1 fil...

solr 配置中文分詞

要在中文的專案中使用 solr 少不了要整合中文分詞元件。本篇以 ik2012 分詞為例,講解如何在 solr 3.5 中及整合中文分詞,使用 ik 的原因 ik 比其他中文分詞維護的勤快,和 solr 整合也相對容易。fieldtypename text zh class solr.textfie...

安裝solr中文分詞系統

solr是乙個國外的開源專案,要想solr能處理中文,必須安裝中文分詞系統,步驟如下 3.拷貝mmseg4j的jar包到solr目錄裡 4.增加詞庫 mkdir p opt solr tomcat solr dic unzip data.zip cp data dic opt solr tomcat...