solr配置中文分詞器

2021-06-28 11:27:53 字數 1389 閱讀 9858

可能需要連線上篇《

solr與tomcat整合》

將data裡的.dic檔案拷貝到dic目錄

3.修改schema.xml檔案,增加下面**(注意你需要修改的是dicpath引數):

<

fieldtype

name="textcomplex"

class="solr.textfield"

>

<

analyzer

>

<

tokenizer

class="com.chenlb.mmseg4j.solr.mmsegtokenize***ctory"

mode="complex"

dicpath="/opt/solr/example/solr/dic"

/>

<

filter

class="solr.lowercasefilte***ctory"

/>

analyzer

>

fieldtype

>

<

fieldtype

name="textmaxword"

class="solr.textfield"

>

<

analyzer

>

<

tokenizer

class="com.chenlb.mmseg4j.solr.mmsegtokenize***ctory"

mode="max-word"

dicpath="/opt/solr/example/solr/dic"

/>

<

filter

class="solr.lowercasefilte***ctory"

/>

analyzer

>

fieldtype

>

<

fieldtype

name="text******"

class="solr.textfield"

>

<

analyzer

>

<

tokenizer

class="com.chenlb.mmseg4j.solr.mmsegtokenize***ctory"

mode="******"

dicpath="/opt/solr/example/solr/dic"

/>

<

filter

class="solr.lowercasefilte***ctory"

/>

analyzer

>

fieldtype

>

4.關聯自己的field欄位即可。

solr配置中文分詞器

一 smartcn 自 1 將自帶的jar包拷貝到tomcat下 檔案 solr 5.1.0 contrib analysis extras lucene libs lucene analyzers smartcn 5.1.0.jar 2 修改schema.xml,新增 3 測試 二 mmseg4j...

solr配置中文分詞器

在 opt solr 7.7.1 server solr article core conf資料夾下的 managed schema檔案中配置ik中文分詞器 測試分詞效果 配置停用詞 擴充套件詞 同義詞 停止詞 的功能是過濾,把 啊 加入到停止詞的字典裡,比如搜尋 你好啊 solr會過濾掉 啊 以 ...

solr配置中文解析 分詞 器

前提 1 在solr中預設是沒有中文分析器的,需要手工配置。需要配置乙個fieldtype,在fieldtype中指定中文分析器。2 solr中的字段必須是先定義後使用。一 使用ik analyzer 把分析器的資料夾上傳到伺服器 root winy ik analyzer 2012ff hf1 p...