在Solr中配置和使用ansj分詞

2021-07-24 23:13:22 字數 880 閱讀 9466

原文:

在上一節【編譯ansj之solr外掛程式

二、在solr schema.xml中配置好ansj欄位型別。

1、建立ansj型別。

找到schema.xml,新增ansj型別text_ansj: 

org.ansj.solr.ansjtokenize***ctory 是ansj-lucene外掛程式。

2、配置好需要索引的字段:

三、在solr環境中配置好ansj。

在編譯好的ansj-seg、nlp-lang、ansj_lucene4_plug 放到solr war包的lib下。

四、測試ansj分詞效果。

ansj配置好了以後,把solr所在的tomcat啟動一下。用solr管理頁面檢視效果:

1、測試分詞 "南京市長江大橋」

solr6使用ansj做中文分詞

solr中有自帶的中文分詞,不過它將中文按乙個乙個字進行分詞,這就導致搜尋出的結果讓人不滿 這裡以text general欄位為例,managed schema中的配置是這樣寫的 生成索引和查詢使用的都是solr.standardtokenize ctory 官方文件有詳細介紹 您配置的文字欄位中鍵...

在linux環境中配置solr

第一步 安裝linux jdk tomcat。第二步 把solr的壓縮包上傳到伺服器。並解壓。我的solr壓縮包是解壓在 usr local solr 包下的 系統預設是沒有solr包的需要自己建立mkdir usr local solr 第三步 把 usr local solr solr 4.10...

solr中配置域

域的常用屬性 2 修改solrhome collection1 conf schema.xml 修改solrhome的 schema.xml 檔案 設定業務系統 field,普通域 field name content ik type text ik indexed true stored true...