MySQL的聚集索引和非聚集索引

2021-08-08 11:52:40 字數 1903 閱讀 8846

一. mysql的索引

mysql中,不同的儲存引擎對索引的實現方式不同,大致說下myisam和innodb兩種儲存引擎。

myisam的b+tree的葉子節點上的data,並不是資料本身,而是資料存放的位址。主索引和輔助索引沒啥區別,只是主索引中的key一定得是唯一的。這裡的索引都是非聚簇索引。

myisam還採用壓縮機制儲存索引,比如,第乙個索引為「her」,第二個索引為「here」,那麼第二個索引會被儲存為「3,e」,這樣的缺點是同乙個節點中的索引只能採用順序查詢。

innodb的資料檔案本身就是索引檔案,b+tree的葉子節點上的data就是資料本身,key為主鍵,這是聚簇索引。非聚簇索引,葉子節點上的data是主鍵(所以聚簇索引的key,不能過長)。為什麼存放的主鍵,而不是記錄所在位址呢,理由相當簡單,因為記錄所在位址並不能保證一定不會變,但主鍵可以保證。

至於為什麼主鍵通常建議使用自增id呢?

二. 聚簇索引

聚簇索引的資料的物理存放順序與索引順序是一致的,即:只要索引是相鄰的,那麼對應的資料一定也是相鄰地存放在磁碟上的。如果主鍵不是自增id,那麼可以想象,它會幹些什麼,不斷地調整資料的實體地址、分頁,當然也有其他一些措施來減少這些操作,但卻無法徹底避免。但,如果是自增的,那就簡單了,它只需要一頁一頁地寫,索引結構相對緊湊,磁碟碎片少,效率也高。

聚簇索引不但在檢索上可以大大滴提高效率,在資料讀取上也一樣。比如:需要查詢f~t的所有單詞。

乙個使用myisam的主索引,乙個使用innodb的聚簇索引。兩種索引的b+tree檢索時間一樣,但讀取時卻有了差異。

因為myisam的主索引並非聚簇索引,那麼他的資料的實體地址必然是凌亂的,拿到這些實體地址,按照合適的演算法進行i/o讀取,於是開始不停的尋道不停的旋轉。聚簇索引則只需一次i/o。

不過,如果涉及到大資料量的排序、全表掃瞄、count之類的操作的話,還是myisam佔優勢些,因為索引所佔空間小,這些操作是需要在記憶體中完成的。

鑑於聚簇索引的範圍查詢效率,很多人認為使用主鍵作為聚簇索引太多浪費,畢竟幾乎不會使用主鍵進行範圍查詢。但若再考慮到聚簇索引的儲存,就不好定論了。

四. 使用場景

動作使用聚簇索引

使用非聚簇索引

列經常被分組排序應應

返回某範圍內的資料應不應

乙個或極少不同值

不應不應

小數目的不同值應不應

大數目的不同值不應應

頻繁更新的列不應應

外來鍵列應

應主鍵列應應

頻繁修改索引列不應應

五. 一些優化原則

1、預設情況下建立的索引是非聚簇索引,但有時它並不是最佳的。在非群集索引下,資料在物理上隨機存放在資料頁上。合理的索引設計要建立在對各種查詢的分析和**上。一般來說: 

a.有大量重複值、且經常有範圍查詢( > ,< ,> =,< =)和order by、group by發生的列,可考 

慮建立群集索引; 

b.經常同時訪問多列,且每列都含有重複值可考慮建立組合索引; 

c.組合索引要盡量使關鍵查詢形成索引覆蓋,其前導列一定是使用最頻繁的列。索引雖有助於提高效能但不是索引越多越好,恰好相反過多的索引會導致系統低效。使用者在表中每加進乙個索引,維護索引集合就要做相應的更新工作。 

2、order by和gropu by使用order by和group by短語,任何一種索引都有助於select的效能提高。 

3、多表操作在被實際執行前,查詢優化器會根據連線條件,列出幾組可能的連線方案並從中找出系統開銷最小的最佳方案。連線條件要充份考慮帶有索引的表、行數多的表;內外表的選擇可由公式:外層表中的匹配行數*內層表中每一次查詢的次數確定,乘積最小為最佳方案。

4、任何對列的操作都將導致表掃瞄,它包括資料庫函式、計算表示式等等,查詢時要盡可能將操作移至等號右邊。 

5、in、or子句常會使用工作表,使索引失效。如果不產生大量重複值,可以考慮把子句拆開。拆開的子句中應該包含索引。

MySQL聚集索引和非聚集索引

mysql的innodb儲存引擎的索引分為聚集索引和非聚集索引兩大類,理解聚集索引和非聚集索引可通過對比漢語字典的索引。漢語字典提供了兩類檢索漢字的方式,第一類是拼音檢索 前提是知道該漢字讀音 比如拼音為cheng的漢字排在拼音chang的漢字後面,根據拼音找到對應漢字的頁碼 因為按拼音排序,二分查...

mysql聚集索引 MySQL索引之聚集索引介紹

在mysql裡,聚集索引和非聚集索引分別是什麼意思,有什麼區別?在mysql中,innodb引擎表是 聚集 索引組織表 clustered index organize table 而myisam引擎表則是堆組織表 heap organize table 也有人把聚集索引稱為聚簇索引。當然了,聚集索...

MySQL系列 聚集索引和非聚集索引

聚集索引 該索引中鍵值的邏輯順序決定了表中相應行的物理順序。聚集索引類似於 簿,後者按姓氏排列資料。由於聚集索引規定資料在表中的物理儲存順序,因此乙個表只能包含乙個聚集索引。但該索引可以包含多個列 組合索引 就像 簿按姓氏和名字進行組織一樣。1 聚集索引使用注意事項 定義聚集索引鍵時使用的列越少越好...