solr配置中文分詞器

2021-07-09 07:59:24 字數 1752 閱讀 3254

一、smartcn**自

1、將自帶的jar包拷貝到tomcat下

檔案:solr-5.1.0/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-5.1.0.jar

2、修改schema.xml,新增

3、測試

二、mmseg4j

2、修改schema.xml,新增以下內容後重啟tomcat

3、測試

三、索引字段加入中文分詞

這裡新建了張表articles

create table `articles` (

`id` int(10) unsigned not null auto_increment,

`title` varchar(200) not null,

`author` varchar(50) not null,

`last_update_time` timestamp not null default current_timestamp on update current_timestamp,

primary key (`id`)

) engine=innodb default charset=utf8;

網上找點資料塞進去

insert into `articles` values ('1', '3.6億曼城又被這臥底坑死!無底黑洞讓1億白花', '梓泉', '2016-01-07 09:43:17');

insert into `articles` values ('2', '瓜帥版曼城豪陣**!組最奢華中軸 梅西領4天王', '小九', '2016-01-07 09:43:41');

insert into `articles` values ('3', '聯賽杯-棄將助小魔獸絕殺 曼城丟爭議球1-2負 ', '斯科', '2016-01-07 09:43:50');

insert into `articles` values ('4', '瓜迪奧拉去曼城已定!英媒:他與前巴薩2巨頭重逢 ', '蘭尼斯特', '2016-01-07 09:44:06');

insert into `articles` values ('5', '曼城主帥諷皇馬:同情貝帥 皇馬幹出這種事不奇怪 ', '馬爾科', '2016-01-07 09:44:18');

solr後台新建core_articles。

修改data-config.xml

'$'">  

修改schema.xml,新增filedtype

再新增相關索引字段

重啟tomcat後全量匯入。

在query裡搜尋的結果

對title欄位進行關鍵字搜尋(如:巴薩)結果

solr配置中文分詞器

可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...

solr配置中文分詞器

在 opt solr 7.7.1 server solr article core conf資料夾下的 managed schema檔案中配置ik中文分詞器 測試分詞效果 配置停用詞 擴充套件詞 同義詞 停止詞 的功能是過濾,把 啊 加入到停止詞的字典裡,比如搜尋 你好啊 solr會過濾掉 啊 以 ...

solr配置中文解析 分詞 器

前提 1 在solr中預設是沒有中文分析器的,需要手工配置。需要配置乙個fieldtype,在fieldtype中指定中文分析器。2 solr中的字段必須是先定義後使用。一 使用ik analyzer 把分析器的資料夾上傳到伺服器 root winy ik analyzer 2012ff hf1 p...