關聯式資料庫查詢優化的初次體驗

最近一直在看關係資料庫系統知識，主要還是從概念上去了解關聯式資料庫的一些知識，之前沒有系統的學習這方面的知識，現在重新去構建這塊的知識體系。學習到關係查詢優化這塊的知識，通過對書本上的分析，了解到查詢優化這塊的知識，起初在我的知識裡，我認為rdbms會優化查詢這塊的內容，即認為所有人寫的查詢被rdbms優化後都是一種執**況。但事實上並不是這樣，rdbms有多種執行策略，但這種策略知識在已有的查詢語句的分析下進行，它依賴於查詢的語句，所以rdbms所做的優化工作其實是有限的，為了驗證這個觀點，我進行了如下實驗。

使用的關聯式資料庫為mysql

建立資料庫student

在student下建立三個表student,course,sc

相應的表結構如下：

表1. student表結構

列名型別(長度)

約束說明

snovarchar(20)

not null primary key

學號sname

varchar(20)

not null

姓名***

char(2)

not null

性別age

smallint

not null

年齡dept

varchar(20)

null

專業名稱

表2. course表結構

列名型別(長度)

約束說明

cnoint

not null primary key

課程號cname

varchar(20)

not null

課程名cpno

intnull

先修課程

credit

smallint

not null

學分表3. sc表結鉤

列名型別(長度)

約束說明

snovarchar(20)

not null foreign key (sno) references student(sno)

學號cno

intnot null foreign key (cno) references student(cno)

課程號grade

smallint

null

成績插入資料：student 100000萬條資料

course100000萬條資料

sc100000萬條資料

查詢要求：

求選修了2號課程的學生姓名。

sql1：

select student.sname from student,sc where student.sno=sc.sno and sc.cno=2;

系統可以用多種等價的關係代數表示式來完成這一查詢：

q1 = π

sname(σ

student.sno=sc.sno

∧sc.cno=2

(student×sc))

q2 = π

sname(σ

sc.cno=2

(student

∞sc))

q3 =π

sname

((student∞σ

sc.cno=2

(sc)))

q1對應的sql語句為：

select temp.sname from (select student.sname,sc.cno as cno,sc.sno as csno from student,sc) astemp where temp.sno=temp.csno and temp.cno=2;

q2對應的sql語句為：

select temp.sname from (select sc.cno as cno,student.sname as sname from student join sc onstudent.sno=sc.sno ) as temp where temp.cno=2

q3對應的sql語句為：

select sname from student join (select sno from sc where sc.cno=2) as temp on student.sno =temp.sno;

通過檢視sql的執行計畫，觀察各個sql的執**況有何不同。

q2對應的sql語句的執行計畫：

圖1 q2 sql語句執行計畫

q3對應的sql語句的執行計畫：

圖2 q3 sql 語句執行計畫

sql1語句執行計畫：

圖3 sql1語句執行計畫

explain select sname from student join sc on student.sno = sc.sno wheresc.cno=2;語句執行計畫：

圖4 使用join進行連線的語句執行計畫

通過對執行計畫的了解，發現sql1語句與q3相對應的sql語句的執行計畫很相似，不同的是q3 中的sql多了乙個臨時表的建立，所以系統在對sql1語句採取了類似於q3 的關係代數表示式來完成查詢。

而且通過對sql1進行變形，使用join進行連線，發現其執行計畫與sql1的執行計畫一樣，說明mysqlrdbms內部還是採用了join來實現連線。

接著對各個sql的執行時間進行對比，發現q1 > q2 > q3 ≈ sql1，q1很慢很慢，q2所用時間大約是q3 的100倍。所以對於查詢的sql語句來說，不同的書寫方式會對執行效率產生很大的影響。

關聯式資料庫查詢優化的初次體驗

關聯式資料庫的查詢優化

關聯式資料庫的查詢優化策略

關聯式資料庫與非關聯式資料庫

關聯式資料庫查詢優化的初次體驗

關聯式資料庫的查詢優化

關聯式資料庫的查詢優化策略

關聯式資料庫與非關聯式資料庫

相關推薦