深入淺出空間索引 2

2021-08-03 15:08:33 字數 1381 閱讀 8914

第一篇講到了傳統的索引如b樹不能很好的支援空間資料,比如點(poi等)、線(道路、河流等)、面(行政邊界、住宅區等)。本篇將對空間索引進行簡單分類,然後介紹網格索引。(深入淺出空間索引1:

一、空間索引有哪幾種?

傳統索引使用雜湊和樹這兩類最基本的資料結構。空間索引雖然更為複雜,但仍然發展於這兩種資料結構。因此可以將空間索引劃分為兩大類:1)基於雜湊思想,如網格索引等;2)基於樹思想,有四叉樹、r樹等。

二、網格索引

雜湊是通過乙個雜湊函式將關鍵字對映到記憶體或外存的資料結構,如何擴充套件到空間資料呢?

2.1. 網格索引原理

擴充套件方法:對地理空間進行網格劃分,劃分成大小相同的網格,每個網格對應著一塊儲存空間,索引項登記上落入該網格的空間物件。

舉個例子,我們將地理空間進行網格劃分,並進行編號。該空間範圍內有三個空間物件,分別是id=5的街道,23的河流和11的商圈。這時候我們可以按照雜湊的資料結構儲存,每個網格對應著乙個儲存桶,而桶裡放著空間物件,比如對2號網格,裡面儲存著id=5的空間物件,對35號網格,桶裡放著id=5和id=23的空間物件。

假如我們要查詢某一空間範圍內有哪些空間物件,比如下面的紅框就表示空間範圍,我們可以很快根據紅框的空間範圍算出它與35號和36號網格相交,然後分別到35號和36號網格中查詢空間物件,最終找出id=5和id=23的空間物件。

2.2. 網格索引缺點 1)

索引資料冗餘

網格與物件之間多對多關係在空間物件數量多、大小不均時造成索引資料冗餘。比如11號商圈這個空間物件在68,69,100,101這4個網格都有儲存,浪費了大量空間。

2)網格的大小難以確定

網格的劃分大小難以確定。網格劃分得越密,需要的儲存空間越多,網格劃分的越粗,查詢效率可能會降低。對於圖a,這個查詢需要查詢4個網格,由於4個網格覆蓋了整個空間,因此這個查詢其實是將空間範圍內所有的點資料都遍歷一遍,失去了索引的意義。

3)很多網格沒有資料

空間資料具有明顯的聚集性,比如poi只在幾個熱點商貿區聚集,在郊區等地方很稀疏,這將導致很多網格內沒有任何空間資料。

下一節將介紹四叉樹。

深入淺出空間索引 2

第一篇講到了傳統的索引如b樹不能很好的支援空間資料,比如點 poi等 線 道路 河流等 面 行政邊界 住宅區等 本篇將對空間索引進行簡單分類,然後介紹網格索引。深入淺出空間索引1 一 空間索引有哪幾種?傳統索引使用雜湊和樹這兩類最基本的資料結構。空間索引雖然更為複雜,但仍然發展於這兩種資料結構。因此...

深入淺出理解索引結構 2

四 其他書上沒有的索引使用經驗總結 1 用聚合索引比用不是聚合索引的主鍵速度快 下面是例項語句 都是提取 25萬條資料 select gid,fariqi,neibuyonghu,reader,title from tgongwen where fariqi 2004 9 16 3326毫秒 sel...

深入淺出理解索引

一 深入淺出理解索引結構 實際上,您可以把索引理解為一種特殊的目錄。sql server提供了兩種索引 聚集索引 clustered index,也稱聚類索引 簇集索引 和非聚集索引 nonclustered index,也稱非聚類索引 非簇集索引 下面,我們舉例來說明一下聚集索引和非聚集索引的區別...