mysql索引儲存檔案 Mysql的索引的儲存策略

2021-10-17 17:59:59 字數 1500 閱讀 6257

索引本質

mysql官方解釋:索引是為mysql提高獲取資料效率的資料結構,為了快速查詢資料。索引是滿足某種特定查詢演算法的資料結構,而這些資料結構會以某種方式指向資料,從而實現高效查詢資料。

b+樹mysql一般以b+樹作為其索引結構,那麼b+樹有什麼特點呢?

樹度為n的話,每個節點指標上限為2n+1

非葉子節點不儲存資料,只儲存指標索引;葉子節點儲存所有資料,不儲存指標

在經典b+樹基礎上增加了順序訪問指標,每個葉子節點都有指向相鄰下乙個葉子節點的指標,如圖所示。主要為了提高區間訪問的效能,例如要找key為20到50的所有資料,只要按著順序訪問路線一次性訪問所有資料節點。

帶順序訪問的b+樹簡圖

區域性性原理和磁碟預讀

那麼為什麼資料庫系統普遍使用b+樹作為索引結構,而不選例如紅黑樹其他結構呢?首先要先來介紹下區域性性原理和磁碟預讀的概念。

一般來說,索引本身較大,不會全部儲存在記憶體中,會以索引檔案的形式儲存在磁碟上。所以索引查詢資料過程中就會產生磁碟io操作,而磁碟io相對於記憶體訪問非常緩慢,因此索引結構要儘量減少磁碟io的訪問次數。

為了減少磁碟io,磁碟往往會進行資料預讀,會從某位置開始,預先向後讀取一定長度的資料放入記憶體,即區域性性原理。因為磁碟順序讀取的效率較高,不需要尋道時間,因此可以提高io效率。

預讀長度一般為頁的整數倍,主存和磁碟以頁作為單位交換資料。當需要讀取的資料不在記憶體時,觸發缺頁中斷,系統會向磁碟發出讀取磁碟資料的請求,磁碟找到資料的起始位置並向後連續讀取一頁或幾頁資料載入記憶體,然後中斷返回,系統繼續執行。而一般資料庫系統設計時會將b+樹節點的大小設定為一頁,這樣每個節點的載入只需要一次io。

mysql索引實現

mysql存在多種儲存引擎的選擇,不同儲存引擎對索引的實現是不同的,本章著重對常見儲存引擎innodb和myisam儲存引擎的索引實現進行討論。

innodb索引實現

innodb中資料檔案和索引檔案是分別儲存在表空間裡。

使用b+樹作為索引結構,資料檔案本身就是索引檔案。資料檔案按照b+樹的結構進行組織,葉節點的data域儲存完整的資料記錄,索引的key即為表的主鍵。下圖為主鍵索引示意圖(盜圖一波)。聚集索引使得搜尋主鍵非常高效。

innodb主索引.png

資料檔案本身按主鍵索引,因此innodb必須要有主鍵。沒有主鍵怎麼指定主鍵?

下圖為輔助索引示意圖,innodb輔助索引的data域儲存的是主鍵的值。搜尋輔助索引需要先根據輔助索引獲取到主鍵值,再根據主鍵到主索引中獲取到對應的資料記錄。

innodb輔助索引.png

myisam索引實現

同樣也是使用b+樹作為索引結構,葉子節點data域儲存的是資料記錄的位址。資料檔案和索引檔案是分別儲存在***.myd和***.myi(***表示資料表名),索引檔案***.myi儲存資料記錄的位址,具體可參考mysql儲存引擎簡介。如圖所示(盜了個圖),為主索引的示意圖。myisam中檢索索引演算法為:首先按照b+樹搜尋演算法搜尋,如果找到指定的key,取出其data域的值,再以data域值為位址查詢對應的資料記錄。因此myisam的索引方式也稱為非聚集索引。

mysql索引儲存形式 MySql索引儲存形式

聚簇索引 聚集索引 非聚簇索引 非聚集索引 是因為儲存引擎不同引起的,儲存引擎中innodb是聚簇索引 myisam是非聚簇索引,聚簇索引是資料與索引儲存在乙個起,非聚簇索引資料乙個檔案 索引乙個檔案,資料與索引不在乙個檔案中。mysql的索引以b tree的資料結構儲存在磁碟,預設儲存引擎為inn...

mysq索引類別

索引都是在儲存引擎層面實現的 1.btree索引 使用b tree資料結構建立的索引,索引值都是按順序存放的,儲存引擎不需要再全表掃瞄,取而代之的是從索引的根節點開始掃瞄,根節點存放了子節點的指標,隨著向下層查詢,隨著查詢值和節點值的比較 指標中右節點葉值的上下限 最終找到記錄。btree索引可以選...

mysql索引儲存 mysql索引和儲存引擎

mysql索引為什麼採用b 樹而不用b樹 1 b 樹只有葉節點存放資料,其餘節點用來索引,而b樹是每個索引節點都會有data域 索引放磁碟中,磁碟io就會增多 2 b 樹所有的data域在葉子節點,並且所有葉子節點之間都有乙個鏈指標。這樣遍歷葉子節點就能獲得全部資料,這樣就能獲得區間訪問了。在資料庫...