MySQL Innodb 索引的原理

回想四年前，我在學習mysql的索引這塊的時候，老師在講索引的時候，是像下面這麼說的

索引就像一本書的目錄。而當使用者通過索引查詢資料時，就好比使用者通過目錄查詢某章節的某個知識點。這樣就幫助使用者有效地提高了查詢速度。所以，使用索引可以有效地提高資料庫系統的整體效能。

嗯，這麼說其實也對。但是呢，大家看完這種說法，其實可能還是覺得太抽象了！因此呢，我還想再深入的細說一下，所以就有了此文！

需要說明的是，我說的內容只在mysql的innodb引擎中是成立的。在sql server、oracle、mysql的mysiam引擎中的正確性，不一定成立！

ok，廢話不多說，開始囉嗦!

先引進聚簇索引和非聚簇索引的概念！

我們平時在使用的mysql中，使用下述語句

create [unique|fulltext|spatial] index index_name
[using index_type]
on tbl_name (index_col_name,...)

建立的索引，如復合索引、字首索引、唯一索引，都是屬於非聚簇索引，在有的書籍中，又將其稱為輔助索引(secondary index)。在後文中，我們稱其為非聚簇索引，其資料結構為b+樹。

那麼，這個聚簇索引，在mysql中是沒有語句來另外生成的。在innodb中，mysql中的資料是按照主鍵的順序來存放的。那麼聚簇索引就是按照每張表的主鍵來構造一顆b+樹，葉子節點存放的就是整張表的行資料。由於表裡的資料只能按照一顆b+樹排序，因此一張表只能有乙個聚簇索引。

在innodb中，聚簇索引預設就是主鍵索引。

這個時候，機智的讀者，應該要問我

如果我的表沒建主鍵呢？

回答是，如果沒有主鍵，則按照下列規則來建聚簇索引

ps:大家還記得，自增主鍵和uuid作為主鍵的區別麼？由於主鍵使用了聚簇索引，如果主鍵是自增id，，那麼對應的資料一定也是相鄰地存放在磁碟上的，寫入效能比較高。如果是uuid的形式，頻繁的插入會使innodb頻繁地移動磁碟塊，寫入效能就比較低了。

先來一張帶主鍵的表，如下所示，pid是主鍵

pidname

birthday

5zhangsan

2016-10-02

8lisi

2015-10-04

11wangwu

2016-09-02

13zhaoliu

2015-10-07

畫出該錶的結構圖如下

如上圖所示，分為上下兩個部分，上半部分是由主鍵形成的b+樹，下半部分就是磁碟上真實的資料！那麼，當我們，執行下面的語句

select * from table where pid='11'

那麼，執行過程如下

如上圖所示，從根開始，經過3次查詢，就可以找到真實資料。如果不使用索引，那就要在磁碟上，進行逐行掃瞄，直到找到資料位置。顯然，使用索引速度會快。但是在寫入資料的時候，需要維護這顆b+樹的結構，因此寫入效能會下降！

ok，接下來引入非聚簇索引!我們執行下面的語句

create index index_name on table(name);

此時結構圖如下所示

大家注意看，會根據你的索引字段生成一顆新的b+樹。因此，我們每加乙個索引，就會增加表的體積，占用磁碟儲存空間。然而，注意看葉子節點，非聚簇索引的葉子節點並不是真實資料，它的葉子節點依然是索引節點，存放的是該索引欄位的值以及對應的主鍵索引(聚簇索引)。

如果我們執行下列語句

select * from table where name='lisi'

此時結構圖如下所示

通過上圖紅線可以看出，先從非聚簇索引樹開始查詢，然後找到聚簇索引後。根據聚簇索引，在聚簇索引的b+樹上，找到完整的資料！

那

什麼情況不去聚簇索引樹上查詢呢？

還記得我們的非聚簇索引樹上存著該索引欄位的值麼。如果，此時我們執行下面的語句

select name from table where name='lisi'

此時結構圖如下

如上圖紅線所示，如果在非聚簇索引樹上找到了想要的值，就不會去聚簇索引樹上查詢。還記得，博主在《select的正確姿勢》提到的索引問題麼：

當執行select col from table where col = ?，col上有索引的時候，效率比執行select * from table where col = ? 速度快好幾倍！

看完上面的圖，你應該對這句話有更深層的理解了。

那麼這個時候，我們執行了下述語句，又會發生什麼呢？

create index index_birthday on table(birthday);

此時結構圖如下

看到了麼，多加乙個索引，就會多生成一顆非聚簇索引樹。因此，很多文章才說，索引不能亂加。因為，有幾個索引，就有幾顆非聚簇索引樹！你在做插入操作的時候，需要同時維護這幾顆樹的變化！因此，如果索引太多，插入效能就會下降!

講到這裡，大家應該清楚的明白索引的原理了！可能細節方面還不夠嚴謹，但是我覺得乙個研發，理解到這裡可以了，夠用了，畢竟我們也不是專業的dba。

希望大家有所收穫！

MySQL Innodb 索引的原理

關於 Mysql innodb的索引

MySQL Innodb 索引的原理

MySQL InnoDB索引相關

MySQL Innodb 索引的原理

關於 Mysql innodb的索引

MySQL Innodb 索引的原理

MySQL InnoDB索引相關

相關推薦