資料庫索引漫談（整理）1

不良的

sql往往來自於不恰當的索引

設計、不充份的

連接條件和不可

優化的

where

子句。在

對它們進行適當的

優化後，其執行速度有了明

顯地提高！

下面我將從

這三個方面分

別進行

總結：

一、不合理的索引

設計 ----

例：表record

有 620000

行，試

看在不同的索引下，下面幾個

sql的運**況：

---- 1.

在 date

上建有一非個群集索引

select count(*) from record where date >'19991201' and date < '19991214'and amount >2000 (25秒)

select date ,sum(amount) from record group by date(55秒)

select count(*) from record where date >'19990901' and place in ('bj','sh') (27秒)

----

分析：----

date

上有大量的重

復值，在非群集索引下，資料在物理上隨機存放在資料

頁上，在範

圍查找

時，必

須執行一次表

掃描才能找到

這一範

圍內的全部行。

---- 2.

在 date

上的乙個群集索引

select count(*) from record where date >'19991201' and date < '19991214' and amount >2000 （14

秒）select date,sum(amount) from record group by date（28

秒）select count(*) from record where date >'19990901' and place in ('bj','sh')（14

秒）----

分析：----

在群集索引下，資料在物理上按

順序在資料

頁上，重

復值也排列在一起，因而在範

圍查找

時，可以先找到

這個範

圍的起末點，且只在

這個範

圍內掃描資料

頁，避免了大範

圍掃描，提高了

查詢速度。

---- 3.

在 place

， date

， amount

上的組

合索引select count(*) from record where date >'19991201' and date < '19991214' and amount >2000 （26

秒）select date,sum(amount) from record group by date（27

秒）select count(*) from record where date >'19990901' and place in ('bj, 'sh')

（< 1

秒）----

分析：----

這是乙個不很合理的

組合索引，因

為它的前

導列是

place

，第一和第二條

sql沒有引用

place

，因此也沒有利用上索引；第三個

sql使用了

place

，且引用的所有列都包含在

組合索引中，形成了索引覆蓋，所以它的速度是非常快的。

---- 4.

在 date

， place

， amount

上的組

合索引select count(*) from record where date >'19991201' and date < '19991214' and amount >2000(< 1秒)

select date,sum(amount) from record group by date（11

秒）select count(*) from record where date >'19990901' and place in ('bj','sh')

（< 1

秒）----

分析：----

這是乙個合理的

組合索引。它將

date

作為前導

列，使每個

sql都可以利用索引，並且在第一和第三個

sql中形成了索引覆蓋，因而效能達到了最

優。---- 5.

總結：

----

預設情況下建立的索引是非群集索引，但有

時它並不是最佳的；合理的索引

設計要建立在

對各種查詢

的分析和

** 上。

一般來說： ①

. 有大量重

復值、且

經常有範

圍查詢（ between, >,<

， >=,< =

）和 order by

、 group by

發生的列，可考

慮建立群集索引； ②

. 經常同時

訪問多列，且

每列都含有重

復值可考

慮建立

組合索引； ③

. 組合索引要盡量使

關鍵查詢

形成索引覆蓋，其前

導列一定是使用最

頻繁的列。

二、不充份的

連接條件：

例：表card

有 7896

行，在card_no

上有乙個非聚集索引，表

account

有 191122

行，在account_no

上有乙個非聚集索引，

試看在不同的表

連接條件下，兩個

sql的執

**況：

select sum(a.amount) from account a,card b where a.card_no = b.card_no（20

秒）select sum(a.amount) from account a,card b where a.card_no = b.card_no and a.account_no=b.account_no

（< 1

秒）----

分析：----

在第乙個

連接條件下，最佳

查詢方案是將

account

作外層

表， card

作內層

表，利用

card

上的索引，其

i/o次數可由以下公式估算

為：外

層表account

上的 22541

頁 +（外層

表 account

的 191122

行 *內層

表 card

上對應

外層表第一行所要

查找的

3 頁） =595907

次 i/o

在第二個

連接條件下，最佳

查詢方案是將

card

作外層

表， account

作內層

表，利用

account

上的索引，其

i/o次數可由以下公式估算

為：外

層表card

上的 1944

頁 +（外層

表 card

的 7896

行 *內層

表 account

上對應

外層表每

一行所要

查找的

4 頁） = 33528

次 i/o 可

見，只有充份的

連接條件，真正的最佳方案才會被

執行。總結

： 1. 多表操作在被

實際執行前，

查詢優化器會根據

連接條件，列出幾

組可能的

連接方案並從中找出系

統開銷最小的最佳方案。

連接條件要充份考

慮帶有索引的表、行數多的表；內外表的

選擇可由公式：外

層表中的匹配行數

* 內層表中

每一次

查找的次數確定，乘

積最小

為最佳方案。 2.

查看執行方案的方法

-- 用 set showplan

on ，打

開 showplan

選項，就可以看到

連接順序、使用何

種索引的資訊；想看更

詳細的資訊，需用

sa 角色

執行dbcc(3604,310,302) 。

漫談資料庫

談到資料庫這個詞，我想無論是菜鳥還是高手都不會感到陌生。隨著資訊化時代的到來，資料庫已被廣泛運用於各類電腦網路和管理系統中。如果沒有資料庫的話，今天的網際網路就不會這樣絢麗多姿我們所看到的企業管理系統將只能成為一種電腦的裝飾品。我有不少朋友，雖然他們對資料庫各有自己的看法，但在有一點上是達成共識...

資料庫索引 1

資料庫索引概念索引是對資料庫表中一列或者多列的值進行排序的一種結構，使用索引可快速訪問資料庫表中的特定資訊。如果想按特定職員的姓名來查詢他或她，則在表中搜尋所有的行進行比較，索引有助於更快的獲取資訊。索引分為聚簇索引和非聚簇索引，聚簇索引是按照資料存放的物理位置為順序的，而非聚簇索引不一樣聚簇...

資料庫索引雜談1

聚集索引結構在sql server中，索引是按b 樹結構來進行組織的。聚集索引的資料排列順序與資料的物理排列順序相同。聚集索引和非聚集索引的根本區別是表記錄的排列順序和與索引的排列順序是否一致.聚集索引表記錄的排列順序與索引的排列順序一致，優點是查詢速度快，因為一旦具有第乙個索引值的紀錄被找到，...

資料庫索引漫談（整理）1

漫談資料庫

資料庫索引 1

資料庫索引雜談1

相關推薦