lucene實現多詞 短語搜尋

2021-08-30 03:18:03 字數 854 閱讀 7739

不知道這個方法是否可行,我簡單做了個測試。貌似還行。把具體的**貼出來分享給大家。

通過paodinganalyzer、ik_analyzer兩個分詞器來實現。具體分出來的無用的字:比如:的、人……,那麼我們可以寫乙個配置檔案。先羅列出一些無用的詞。那麼我們在建立索引的時候。就自動的把這些字給過濾掉。我是這麼實現的。

public static treesetgetexclusivestringlist2(string fieldname, string string);

treesettreesetstring = new treeset();

for (int i = 0; i < analyzer.length; i++)

}} catch (parseexception e)

}for (iteratoriterator = treesetstring.iterator(); iterator.hasnext();)

return treesetstring;

}乙個main方法測試:

public static void main(stringargs)                            sortbylastmodifyhits(indexsearcher,query,searcherutil.getfilter(contentquery),searcherutil.sort);

sortbylastmodifyhits hits;

synchronized (indexsearcher)

listlist = hits.searcher();  

system.out.println("記錄數:" + list.size());

}

Lucene 搜尋方法(多短語搜尋)

短語搜尋解決了短語搜尋的問題,在很多情況下,使用者輸入某個關鍵字時,該關鍵字可以喝多種單字組成短語,例如,使用者輸入乙個 聲 字。它可以和 聲音 宣告 等字組成短語。lucene提供了multiphrasequery來進行多短語搜尋。public static void main string ar...

Lucene 搜尋方法(短語搜尋)

public static void main string args try indexsearcher search new indexsearcher d demo phrasequery query new phrasequery term term1 new term bookname 鋼...

Lucene 搜尋詞分詞

搜尋詞分詞也即對使用者輸入的搜尋詞進行分詞處理,如 民族 信仰 如果不對它進行分詞,可能搜尋不到東西,但單獨搜尋 民族 或 信仰 抑或 民族信仰 都可以搜到東西,故要對其進行分詞。兩種方法 1 空格分詞,字串處理 單個詞項搜尋的 修改後的,空格隔開的多個詞項的搜尋 2 利用ik等中文分詞元件 使用和...