索引和索引例項分析

2021-09-19 05:16:18 字數 3592 閱讀 8164

資料庫索引,是資料庫管理系統中乙個排序的資料結構,以協助快速查詢、更新資料庫表中資料。就像我們以前用的新華字典的目錄一樣,能幫助我們快速查詢到某乙個字。

分類角度

索引名稱

資料結構

b+樹,hash索引,r-tree等

儲存層面

聚簇索引,非聚簇索引

邏輯層面

主鍵索引,普通索引,復合索引,唯一索引,空間索引等

innodb下,表都是根據主鍵順序以索引的形式存放的,這種資料儲存方式也被稱為聚簇索引,「聚簇」就是表示資料行和相鄰的鍵值緊湊的儲存在一起,也就是資料行實際上是儲存在索引的葉子頁中。我們建立一張表來實際說明下innodb下的索引結構,建表語句如下:

create table person(

id int primary key,

age int not null

index (age)engine=innodb;

然後我們插入五條資料分別為(1,15),(2,17),(6,20),(10,18),(19,21),索引的樹結構如下:

上圖中展示了兩部分內容,第乙個圖為聚簇索引(主鍵索引)的內容,可以看到,資料按照id的大小排序,對應的索引會包含該索引的整行資料。

第二個圖展示了用age做索引的索引結構圖,也就是非聚簇索引(非主鍵索引),可以看到索引以年齡排序,但是和主鍵索引不同的是,年齡索引對應的卻是id,所以我們可以知道非主鍵索引記錄的內容就是主鍵索引的值。

這裡可能有同學會有疑問,如果我建表的時候沒有指定主鍵的話,索引結構又是如何的呢?其實在innodb中,如果沒有定義主鍵,那麼他會選擇乙個唯一的非空索引代替。如果沒有這樣的索引,那麼他會隱式的定義乙個主鍵來作為聚簇索引。所以無論你是否設定主鍵,innodb還是會幫你滿足以上圖的形式來索引資料。接下來我們分析下索引查詢的流程。

假設我們執行一條查詢語句select * from person where id = 6,因為直接使用的是主鍵id查詢,所以就會用主鍵索引,由於主鍵索引直接關聯了整行所有資料,所以,引擎只要執行一次就能查詢出結果。

如果執行的sql語句是非主鍵索引

select * from person where age = 18

上述語句會走age的普通索引,索引先根據age搜尋等於18的索引記錄,找到id=10的記錄,然後再到主鍵索引搜尋一次,然後拿出需要查詢的資料。

從普通索引查出主鍵索引,然後查詢出資料的過程叫做回表。由於回表需要多執行一次查詢,這也是為什麼主鍵索引要比普通索引要快的原因,所以,我們要盡量使用主鍵查詢。

我們通常建立索引的依據都是根據查詢的where條件,但是這只是我們通常的做法,我們根據上面的分析可以知道,如果要想查詢效率高,第一,使用主鍵索引,第二,避免回表,也就是盡可能的在索引中就能獲取想要的資料。如果乙個索引包含了需要查詢的字段,那麼我們就叫做「覆蓋索引」。

那麼如何建立乙個覆蓋索引呢?答案是通過聯合索引來實現,通過聯合索引的字段來覆蓋要查詢的字段,從而達到索引覆蓋的效果。

我們把上面的建表語句改造下,來分析下如何實現覆蓋索引。

create table `person` (

`id` int(11) not null,

`age` int(11) default null,

`name` varchar(20) default null,

`***` varchar(1) default null,

primary key (`id`),

key `name_age` (`name`,`age`)

) engine=innodb default charset=latin1;

上面我建立了乙個name和age的聯合索引,索引結構圖表示如下:

我們根據圖可以知道,聯合索引是和建立索引字段順序有關的,上面這個例子就是先以name排序,然後name相同再以age為標準排序。那麼我們建表後該如何達到覆蓋索引的效果呢?相信有些同學已經知道了怎麼寫sql可以達到覆蓋索引效果,sql如下:

select name,age from person where name = "barry"

因為我們需要查詢的字段name和age,都在索引中可以直接查詢到了,所以不需要查詢到主鍵id,然後再回表了。

看到這裡,肯定有同學會說,既然這樣的話,我把所有需要查詢的字段組合都建上聯合索引不就行了嗎?答案是:不行。因為索引也是需要消耗空間的,而且維護索引也是需要成本的,這一點我會在後面的優缺點中提到。那麼有沒有別的方式可以盡可能的實現不回表的效果呢?這裡我們就要引入mysql的最左字首原則了。

什麼叫最左字首原則呢?就是在索引的匹配中,可以以索引的最左n個字段,也可以是字串索引的最左n個字元。比如在上圖中,要查詢以a開頭的名字,查詢語句就是

select name from person where name like 'a%'

這個時候就可以滿足最左字首規則來使用索引查詢了,這裡就會依賴索引查詢到第乙個首字母是a的名字,然後向後遍歷,直到不滿足條件為止。

那麼最左n個字段是什麼意思呢?意思就是索引(name,age),可以直接利用 name來當做單獨索引使用,可以只使用聯合索引的部分字段,但是必須是順序一致,比如索引(a,b,c),如果要想使用最左字首規則,可以使用索引a,ab。

我們也可以利用該規則來少維護乙個或多個索引,比如我們需要 a,ab,abc的查詢,那就只需要(a,b,c)聯合索引就滿足要求了。

在mysql 5.6版本中引入了乙個新特性,叫做「索引條件推送(index condition pushdown)」,這也稱為索引下推。那麼索引下推是這個什麼東東呢?其實從「索引條件推送」這個名字就可以表明,這個特性是可以在索引中的字段進行條件判斷,然後過濾不滿足條件的記錄,減少回表的次數。

比如以上圖中的資料為準,sql如下:

select * from person where name like 'a%' and age =19;

那麼如果沒有索引下推的情況下,首先會根據索引查詢出名字以a開頭的所有記錄,然後查詢出id,然後回表去查詢對應的id記錄,最後再判斷age=19,返回滿足條件的語句。因為滿足a開頭的記錄有2條,所以這種情況下,會回表2次。

在索引下推情況下,innodb會在索引內部直接判斷age=19是否滿足條件,過濾掉不滿足條件的記錄,所以只返回了一條,也就是只需要回表一次。從而提高了效能。

說了這麼多關於索引的內容,我們來談談索引的優缺點。

優點:缺點

這篇博文我主要說了,索引的定義,索引的分類,索引按照不同的角度可以分為常見的哪幾種。然後我重點說了在innodb下索引的索引的資料結構。 主鍵索引和非主鍵索引的區別就是查詢主鍵索引可以直接返回資料,非主鍵索引需要先查詢出主鍵id,然後再查詢出資料,這個過程就叫做回表。我們可以通過覆蓋索引減少回表的次數,從而達到提高效能的效果。在mysql5.6以後,innodb可以支援索引下推,在使用聯合索引的時候,如果可以在索引判斷條件,那麼就在索引中過濾不滿足條件的行,從而減少回表次數。

聚集索引和非聚集索引例項

create database myindexdemo gouse myindexdemo gocreate table abc a int not null,b char 10 c varchar 10 go insert into abc select 1,b c union select 5,...

MySQL索引用法例項分析

mysql描述 乙個文章庫,裡面有兩個表 category和art程式設計客棧icle。category裡面有10條分類資料。article裡面有20萬條。article裡面有乙個 article category 欄位是與category裡的 category id 字段相對應的。article表...

索引原理及專案中如何使用索引例項分析

一.索引原理 為認識索引工作原理,首先有必要對資料表的基本結構作一次全面的複習。當乙個新錶被建立之時,系統將在磁碟中分配一段以8k為單位的連續空間,當字段的值從記憶體寫入磁碟時,就在這一既定空間隨機儲存,當乙個8k用完的時候,sqls指標會自動分配乙個8k的空間。這裡,每個8k空間被稱為乙個資料頁 ...