深入研究B樹索引(一)

2021-05-04 15:28:42 字數 3374 閱讀 9212

索引與表一樣,也屬於段(

segment

)的一種。裡面存放了使用者的資料,跟表一樣需要占用磁碟空間。只

不過,在索引裡的資料存放形式與表裡的資料存放形式非常的不一樣。在理解索引時,可以想象一本書,其中書的內容就相當於表裡的資料,而書前面的目錄就相當於該錶的索引。同時,通常情況下,索引所占用的磁碟空間要比表要小的多,其主要作用是為了加快對資料的搜尋速度,也可以用來保證資料的唯一性。

但是,索引作為一種可選的資料結構,你可以選擇為某個表裡的建立索引,也可以不建立。這是因為一旦建立了索引,就意味著

oracle

對錶進行

dml(包括

insert

、update

、delete

)時,必須處理額外的工作量(也就是對索引結構的維護)以及儲存方面的開銷。所以建立索引時,需要考慮建立索引所帶來的查詢效能方面的提高,與引起的額外的開銷相比,是否值得。

從物理上說,索引通常可以分為:分割槽和非分割槽索引、常規

b樹索引、位圖(

bitmap

)索引、翻轉(

reverse

)索引等。其中,

b樹索引屬於最常見的索引,由於我們的這篇文章主要就是對

b樹索引所做的**,因此下面只要說到索引,都是指

b樹索引。 b

樹索引是乙個典型的樹結構,其包含的元件主要是: 1)

葉子節點(

leaf node

):包含條目直接指向表裡的資料行。 2)

分支節點(

branch node

):包含的條目指向索引裡其他的分支節點或者是葉子節點。 3)

根節點(

root node

):乙個

b樹索引只有乙個根節點,它實際就是位於樹的最頂端的分支節點。

可以用下圖一來描述

b樹索引的結構。其中,

b表示分支節點,而

l表示葉子節點。

對於分支節點塊(包括根節點塊)來說,其所包含的索引條目都是按照順序排列的(預設是公升序排列,也可以在建立索引時指定為降序排列)。每個索引條目(也可以叫做每條記錄)都具有兩個字段。第乙個字段表示當前該分支節點塊下面所鏈結的索引塊中所包含的最小鍵值;第二個欄位為四個位元組,表示所鏈結的索引塊的位址,該位址指向下面乙個索引塊。在乙個分支節點塊中所能容納的記錄行數由資料塊大小以及索引鍵值的長度決定。比如從上圖一可以看到,對於根節點塊來說,包含三條記錄,分別為(

0 b1

)、(500 b2

)、(1000 b3

),它們指向三個分支節點塊。其中的0、

500和

1000

分別表示這三個分支節點塊所鏈結的鍵值的最小值。而b1、

b2和b3則表示所指向的三個分支節點塊的位址。

對於葉子節點塊來說,其所包含的索引條目與分支節點一樣,都是按照順序排列的(預設是公升序排列,也可以在建立索引時指定為降序排列)。每個索引條目(也可以叫做每條記錄)也具有兩個字段。第乙個字段表示索引的鍵值,對於單列索引來說是乙個值;而對於多列索引來說則是多個值組合在一起的。第二個字段表示鍵值所對應的記錄行的

rowid

,該rowid

是記錄行在表裡的實體地址。如果索引是建立在非分割槽表上或者索引是分割槽表上的本地索引的話,則該

rowid占用6

個位元組;如果索引是建立在分割槽表上的全域性索引的話,則該

rowid

占用10

個位元組。

知道這些資訊以後,我們可以舉個例子來說明如何估算每個索引能夠包含多少條目,以及對於表來說,所產生的索引大約多大。對於每個索引塊來說,預設的

pctfree為10

%,也就是說最多只能使用其中的

90%。同時

9i以後,這

90%中也不可能用盡,只能使用其中的

87%左右。也就是說,

8kb的資料塊中能夠實際用來存放索引資料的空間大約為

6488

(8192×90

%×88

%)個位元組。

假設我們有乙個非分割槽表,表名為

warecountd

,其資料行數為

130萬行。該表中有乙個列,列名為

goodid

,其型別為

char(8

),那麼也就是說該

goodid

的長度為固定值:

8。同時在該列上建立了乙個

b樹索引。

在葉子節點中,每個索引條目都會在資料塊中佔一行空間。每一行用2到

3個位元組作為行頭,行頭用來存放標記以及鎖定型別等資訊。同時,在第乙個表示索引的鍵值的字段中,每乙個索引列都有

1個位元組表示資料長度,後面則是該列具體的值。那麼對於本例來說,在葉子節點中的一行所包含的資料大致如下圖二所示:

從上圖可以看到,在本例的葉子節點中,乙個索引條目佔

18個位元組。同時我們知道

8kb的資料塊中真正可以用來存放索引條目的空間為

6488

位元組,那麼在本例中,乙個資料塊中大約可以放

360(

6488/18

)個索引條目。而對於我們表中的

130萬條記錄來說,則需要大約

3611

(1300000/360

)個葉子節點塊。

而對於分支節點裡的乙個條目(一行)來說,由於它只需儲存所鏈結的其他索引塊的位址即可,而不需要儲存具體的資料行在**,因此它所占用的空間要比葉子節點要少。分支節點的一行中所存放的所鏈結的最小鍵值所需空間與上面所描述的葉子節點相同;而存放的索引塊的位址只需要

4個位元組,比葉子節點中所存放的

rowid少了2

個位元組,少的這

2個位元組也就是

rowid

中用來描述在資料塊中的行號所需的空間。因此,本例中在分支節點中的一行所包含的資料大致如下圖三所示:

從上圖可以看到,在本例的分支節點中,乙個索引條目佔

16個位元組。根據上面葉子節點相同的方式,我們可以知道乙個分支索引塊可以存放大約

405(

6488/16

)個索引條目。而對於我們所需要的

3611

個葉子節點來說,則總共需要大約

9個分支索引塊。

這樣,我們就知道了我們的這個索引有

2層,第一層為

1個根節點,第二層為

9個分支節點,而葉子節點數為

3611

個,所指向的表的行數為

1300000

行。但是要注意,在

oracle

的索引中,層級號是倒過來的,也就是說假設某個索引有

n層,則根節點的層級號為

n,而根節點下一層的分支節點的層級號為

n-1,依此類推。對本例來說,

9個分支節點所在的層級號為

1,而根節點所在的層級號為2。

flex Bindable深入研究

bindable 元資料標籤,它在 中的作用就是向編譯器提供如何編譯程式的資訊。它的最大作用是使程式元件間的資料同步變得容易。在開發中通常用上bindable作用在檢視控制項上,如給它繫結乙個物件,則以後只需要在邏輯層更改這個物件的值,則檢視層的控制項資料會自動更新 同步 而不再需要手動去更新檢視。...

URLRequest深入研究

urlrequest 的乙個例項 html view plain copy create the request.所構建的nsurlrequest具有乙個依賴於快取響應的特定策略,cachepolicy取得策略,timeoutinterval取得超時值 nsurlrequest therequest...

深入研究AsyncTask

asynctask提供了一種在後台執行操作而在ui執行緒顯示結果的方式,而且開發者不必操作執行緒或者handler.乙個asynctask定義了三種泛型分別是params,progress,result,還有四個函式分別是onpreexecute doinbackground onprogressu...