lucene4 x收集器Collector介紹

2021-08-19 06:24:15 字數 418 閱讀 6093

主要用於從搜尋中收集原始結果,並實現排序或自定義結果過濾、排序等。包含以下四個抽象方法:

setscorer:在連續呼叫collect方法之前呼叫,需要文件評分的實現,需要儲存傳遞進來的scorer,並在需要的時候呼叫scorer.score()。

setnextreader:在從每個atomicreadercontext中收集之前呼叫。collect(int)中的所有文件編號都是相對於indexreadercontext.reader的。

acceptsdocsoutoforder:如果收集器不需要匹配的文件id以整數從小到大的排序來收集則返回true。大多數lucene查詢實現按順序訪問匹配的文件id。如果收集器允許文件id不按順序返回,一些查詢可以實現更快的查詢。

lucene4 x的分組實現

lucene在4.x之前,沒有實現分組的功能,如果業務中有需要分組的功能,那麼必須的借助第三方的提供的外掛程式,來實現分組,例如bobo browse,或者,自己用lucene寫分組功能,筆者個人覺得用第三方的分組外掛程式,雖說功能強大,但是比較繁瑣,自己寫的話,可以實現,但是效率方面卻不是很好,在...

JVM垃圾收集器之CMS收集器

cms concurrent mark sweep 收集器是一種以獲取最短 停頓時間為目標的收集器。1 cms使用的演算法 cms使用的演算法為 標記 清除 演算法 2 執行過程4步驟 a 初始標記 cms initial mark b 併發標記 cms concurrent mark c 重新標記...

並行收集器

預設情況下伺服器上選擇並行收集器。1 並行收集器 這裡也稱為吞吐量收集器 是類似於序列收集器的分代收集器 主要區別在於多個執行緒用於加速垃圾收集。使用命令列選項啟用並行收集器 xx useparallelgc。2 可以使用命令列選項控制垃圾收集器執行緒的數量 xx parallelgcthreads...