IK分詞器基礎安裝入門

2021-10-09 04:20:43 字數 1276 閱讀 9448

進入到elasticsearch的安裝目錄下, 找到bin目錄。 執行裡面的elasticsearch-plugin命令,這個命令是管理es中的外掛程式的。 ik分詞器就是乙個外掛程式。

執行下面這個命令就可以安裝成了, 注意ik分詞器的版本要和es的版本一致才行。 具體哪個版本可以去github中去找。

bin/elasticsearch-plugin install
安裝完成之後需要重啟一下es服務。 直接kill掉,在啟動。

這裡面的最後一部是說如果詞句裡面有英文的話,還會在進行分詞過濾 。

智慧型分詞法和最大化分詞法。

智慧型分詞法就是盡量的保證不會有重複分詞的情況下分詞。

最大化分詞,是說只要是乙個詞或者有意義的字都給分開。如下圖: 有很多字重複出現了, 也有乙個字就做為乙個詞。

可以看到下面這個圖, 分成三部分, 乙個是搜尋儲存做為中心儲存資料。 二個是構建索引處理器通過分詞規則將資料儲存到搜尋儲存中。 三個是客戶端將要搜尋的詞進行分詞,然後分到這個分詞去搜尋儲存查詢。 其中第二部分和第三部分都使用到了分詞器,而這個分詞器是可以使用不同的分詞器。

最佳實踐: 索引資料的時候使用max_word,但是在查詢的時候使用smart_word。當沒有召回的時候,可以在搜尋的時候指定使用max_word分詞器。

停用詞和主分詞都包含在ik的配置檔案中,可以在config目錄下檢視。

es會在config目錄下給外掛程式建立自己的目錄 。可以看到紅色的為主分詞檔案,綠色的為停用詞檔案

停用詞就是說詞的時候,這些詞不做為乙個詞建立索引 。

主分詞就是這些詞會做乙個分詞建立索引 。

可以看一下main.dic的內容。

ik分詞器安裝

官方demo es中plugins最終結果 es中conf analysis ik的最終結果 執行 plugin安裝 1.查詢es程序 ps ef grep elastic 2.殺掉es程序 kill 9 2382 程序號 3.重啟es sh elasticsearch d 1.通過rest方式建立...

ik分詞器安裝

lucene的ik分詞器早在2012年已經沒有維護了,現在我們要使用的是在其基礎上維護公升級的版本,並且開發為elasticsearch的整合外掛程式了,與elasticsearch一起維護公升級,版本也保持一致,最新版本 6.3.0 上傳課前資料中的zip包,解壓到elasticsearch目錄的...

Elasticsearch安裝IK分詞器

安裝方式大概分為兩種 自行編譯 使用elasticsearch rtf版,利用別人編譯好的檔案進行安裝 環境說明 自行編譯的步驟如下 index analysis analyzer ik alias ik analyzer type org elasticsearch index analysis ...