Lucene中使用Paoding中文分詞

2021-06-01 21:46:24 字數 824 閱讀 8576

1,把paoding-analysis-2.0.4-beta解壓縮,給專案中加入paoding-analysis.jar。

2,把dic資料夾放到專案的根目錄中。dic資料夾裡是paoding的詞庫。

#values are "system-env" or "this";

#if value is "this" , using the paoding.dic.home as dichome if configed!

#paoding.dic.home.config-fisrt=system-env

paoding.dic.home.config-fisrt=this

#dictionary home (directory)

#"classpath:***" means dictionary home is in classpath.

#e.g "classpath:dic" means dictionaries are in "classes/dic" directory or any other classpath directory

#paoding.dic.home=dic

paoding.dic.home=classpath:dic

#seconds for dic modification detection

#paoding.dic.detector.interval=60

修改paoding .dic .home .config-fisrt=this ,使得程式知道該配置檔案

修改paoding .dic .home =classpath:dic ,指定字典的所在路徑。絕對路徑也可以,但是不好。

Lucene中使用分頁

lucene3.5中提供了乙個分頁方法 searchafter方法,可以方便的分頁,不過仍然需要把大量資料取出。分頁搜尋 把所有資料都取出來才行 可以把每次需要分頁的內容取出來,沒有必要一次性取出所有的東西 比如 每頁存放10個內容,需要第一頁就取出10個內容,需要第二頁就去取出20個內容 retu...

Lucene中使用Paoding中文分詞

1,把paoding analysis 2.0.4 beta解壓縮,給專案中加入paoding analysis.jar。2,把dic資料夾放到專案的根目錄中。dic資料夾裡是paoding的詞庫。3,配置paoding的詞庫 把paoding analysis 2.0.4 beta src裡面的p...

Lucene使用總結

1 引入lucene相關的jar,本實驗採用的是如下版本,現在最新的版本為3.0 lucene core 2.4.0.jar lucene analyzers 2.4.0.jar lucene highlighter 2.4.0.jar je analysis 1.5.3.jar 2 lucene3...