Solr的TrieField範圍查詢分析

solr從1.4版本開始，提供了一種字段型別triefield（trielongfield、trieintfield等），用於範圍查詢，效能比普通的數值型別要快10倍。為什麼會快那麼多呢？網上找不到相關資料，通過分析源**，大概了解了其原理，給大家分享下。

其中precisionstep代表字段值分段儲存的時候，截斷精度的大小。一般來說，其值越小，索引大小越大，查詢速度越快。

查詢的過程：

1、將查詢的範圍a~b的上下界a、b值,取出最高8位，標記為a1、b1，到第一段找在(a1~b1)內的term，得到需要查詢的termlist1

2、繼續取a、b值的最高16位，標記為a2、b2，到第二段來查在(a2~a1 11111111]和[b1 11111111,b2)範圍內的term，得到termlist2

3、繼續取a、b值的最高24位，標記為a3、b3，到第三段來查在(a3~a2 11111111]和[b2 11111111,b3)範圍內的term，得到termlist3

4、繼續取a、b值的最高24位，也即a、b值，到第四段來查詢[a~a3 11111111]和[b3 11111111,b]範圍內的term，得到termlist4

5、最後查詢這些term，歸併，就得到了符合查詢條件的docid了。從上面的描述，我們可以看到，需要查詢的term最多為254+2552+2552+256*2=1786個，傳統的方式a~b個term要小的多，因此效能有很大的提公升。

本文**於"阿里中介軟體團隊播客",原文發表時間"2012-05-05 "