安裝solr中文分詞系統

2021-06-22 20:09:04 字數 844 閱讀 3668

solr是乙個國外的開源專案,要想solr能處理中文,必須安裝中文分詞系統,步驟如下:

3. 拷貝mmseg4j的jar包到solr目錄裡:4. 增加詞庫:

# mkdir -p /opt/solr-tomcat/solr/dic

# unzip data.zip

# cp data/*dic /opt/solr-tomcat/solr/dic

# chown -r tomcat:tomcat /opt/solr-tomcat/solr/dic

5. 修改 solr 的配置檔案:

進入我們的core配置目錄(/opt/solr-tomcat/solr/mediskin/conf), 開啟schema.xml檔案,找到合適位置,增加:

再開啟 solrconfig.xml, 找到合適位置,增加:

dic

6 重啟tomcat6, 檢查中文分詞是否能正常工作:

# service tomcat6 restart

在瀏覽器裡訪問solr頁面,在面選單下方選擇剛配置好的core, mediskin,選擇analysis。在出現的頁面裡,field value中輸入"夏季皮炎如何**",在analyse fieldname / fieldtype裡,選擇 textmaxword,按analyse value,應該能看到正確的分詞效果。

solr 配置中文分詞

要在中文的專案中使用 solr 少不了要整合中文分詞元件。本篇以 ik2012 分詞為例,講解如何在 solr 3.5 中及整合中文分詞,使用 ik 的原因 ik 比其他中文分詞維護的勤快,和 solr 整合也相對容易。fieldtypename text zh class solr.textfie...

solr 實現 中文分詞,IK Analyzer

solr 預設是不支援中文分詞的,這樣就需要我們手工配置中文分詞器,在這裡我們選用 ik analyzer 中文分詞器。ik analyzer 如圖 solr 在這裡我們使用 solr 4.10.4 版本試驗環境 centos 6.5 jdk1.7 整合步驟 1ik analyzer 2012 ff...

solr配置中文分詞器

可能需要連線上篇 solr與tomcat整合 將data裡的.dic檔案拷貝到dic目錄 3.修改schema.xml檔案,增加下面 注意你需要修改的是dicpath引數 fieldtype name textcomplex class solr.textfield analyzer tokeniz...