solr4 5配置中文分詞器mmseg4j

2021-09-08 11:05:46 字數 632 閱讀 8382

solr4.x雖然提供了分詞器,但不太適合對中文的分詞,給大家推薦乙個中文分詞器mmseg4j

通過以下幾步就可以把mmseg4j分詞器整合到solr中:

1、解壓mmseg4j-1.9.1.zip,把dist下面的所有jar檔案拷貝到你應用伺服器下的solr/web-inf/lib中(如果你的應用伺服器下面沒有solr,請參考《solr部署到tomcat》)。

2、拷貝data到solr_home/solr中(與core檔案平級),並改名為dic(請參考《solr部署到tomcat》)

3、進入到你想使用mmseg4j分詞器的core中(此處以solr自帶的collection1為例),用編輯器開啟collection1/conf/schema.xml配置檔案,新增如下**:

solr.textfield" >

4、引用mmseg4j分詞器

上面我們已經定義了mmseg4j分詞器,如何引用呢?

用編輯器開啟collection1/conf/schema.xml配置檔案,找到…,修改需要使用中文分詞的字段,type=」text_mmseg4j」

.......//省略

通過以上步驟就可以成功配置mmseg4j分詞器到solr中了。

solr4 5配置中文分詞器mmseg4j

solr4.x雖然提供了分詞器,但不太適合對中文的分詞,給大家推薦乙個中文分詞器mmseg4j 通過以下幾步就可以把mmseg4j分詞器整合到solr中 1 解壓mmseg4j 1.9.1.zip,把dist下面的所有jar檔案拷貝到你應用伺服器下的solr web inf lib中 如果你的應用伺...

solr4 5配置中文分詞器mmseg4j

solr4.x雖然提供了分詞器,但不太適合對中文的分詞,給大家推薦乙個中文分詞器mmseg4j 通過以下幾步就可以把mmseg4j分詞器整合到solr中 1 解壓mmseg4j 1.9.1.zip,把dist下面的所有jar檔案拷貝到你應用伺服器下的solr web inf lib中 如果你的應用伺...

solr配置中文分詞器

可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...