solr安裝mmseg4j 分詞器

2021-07-03 20:09:16 字數 521 閱讀 6079

注意版本:

2.拷貝jar

3.準備自定義詞庫

1.6版支援多個詞庫檔案,定義的目錄下讀到"words"字首且".dic"為字尾的檔案,如:

f:\dic\

words-mmseg4j.dic。新增自定義詞條,一條一行(注意,必須utf-8編碼格式)。如下圖所示:

4.配置schema.xml

dicpath="f:\dic"/>

其中,dicpath為自定義詞庫路徑,絕對路徑測試通過。相對路徑,說是相對於solr_home的,沒有測試通過,有通過的請指點! 

5.重啟tomcat測試即可,如果是solrcloud,不需要重啟,重新建立索引即可。如下圖:

其中,州廣為自定義詞

solr整合mmseg4j實現中文分詞檢索

1 使用mmseg4j 1.9版本 mmseg4j core 1.9.0.jar 包括詞庫檔案 mmseg4j analysis 1.9.0.jar 是一些 analysis mmseg4j solr 1.9.0.jar 是一些 solr 使用的功能。2 將mmseg的jar放入solr web i...

solr4 5配置中文分詞器mmseg4j

solr4.x雖然提供了分詞器,但不太適合對中文的分詞,給大家推薦乙個中文分詞器mmseg4j 通過以下幾步就可以把mmseg4j分詞器整合到solr中 1 解壓mmseg4j 1.9.1.zip,把dist下面的所有jar檔案拷貝到你應用伺服器下的solr web inf lib中 如果你的應用伺...

solr4 5配置中文分詞器mmseg4j

solr4.x雖然提供了分詞器,但不太適合對中文的分詞,給大家推薦乙個中文分詞器mmseg4j 通過以下幾步就可以把mmseg4j分詞器整合到solr中 1 解壓mmseg4j 1.9.1.zip,把dist下面的所有jar檔案拷貝到你應用伺服器下的solr web inf lib中 如果你的應用伺...