小溫談資料庫優化 資料庫設計篇

2021-09-22 10:44:12 字數 2798 閱讀 3999

三大正規化:

第1規範:沒有重複的組或多值的列,這是資料庫設計的最低要求。

第2規範: 每個非關鍵字段必須依賴於主關鍵字,不能依賴於乙個組合式主關鍵字的某些組成部分。消除部分依賴,大部分情況下,資料庫設計都應該達到第二正規化。

第3規範: 乙個非關鍵字段不能依賴於另乙個非關鍵字段。消除傳遞依賴,達到第三正規化應該是系統中大部分表的要求,除非一些特殊作用的表。

更高的正規化要求這裡就不再作介紹了,個人認為,如果全部達到第二正規化,大部分達到第三正規化,系統會產生較少的列和較多的表,因而減少了資料冗餘,也利於效能的提高。

完全按照三大正規化規範化設計的系統幾乎是不可能的,除非系統特別的小,在規範化設計後,有計畫地加入冗餘是必要的。冗餘可以是冗餘資料庫、冗餘表或者冗餘字段,不同粒度的冗餘可以起到不同的作用。冗餘可以是為了程式設計方便而增加,也可以是為了效能的提高而增加。從效能角度來說,冗餘資料庫可以分散資料庫壓力,冗餘表可以分散資料量大的表的併發壓力,也可以加快特殊查詢的速度,冗餘字段可以有效減少資料庫表的連線,提高效率。

主鍵的設計

主鍵是必要的,sql server的主鍵同時是乙個唯一索引,而且在實際應用中,我們往往選擇最小的鍵組合作為主鍵,所以主鍵往往適合作為表的聚集索引。聚集索引對查詢的影響是比較大的,這個在下面索引的敘述。

在有多個鍵的表,主鍵的選擇也比較重要,一般選擇總的長度小的鍵,小的鍵的比較速度快,同時小的鍵可以使主鍵的b樹結構的層次更少。

主鍵的選擇還要注意組合主鍵的字段次序,對於組合主鍵來說,不同的字段次序的主鍵的效能差別可能會很大,一般應該選擇重複率低、單獨或者組合查詢可能性大的字段放在前面。

外來鍵的設計

外來鍵作為資料庫物件,很多人認為麻煩而不用,實際上,外來鍵在大部分情況下是很有用的,理由是:

外來鍵是最高效的一致性維護方法,資料庫的一致性要求,依次可以用外來鍵、check約束、規則約束、觸發器、客戶端程式,一般認為,離資料越近的方法效率越高。

謹慎使用級聯刪除和級聯更新,級聯刪除和級聯更新作為sql server 2000當年的新功能,在2005作了保留,應該有其可用之處。我這裡說的謹慎,是因為級聯刪除和級聯更新有些突破了傳統的關於外來鍵的定義,功能有點太過強大,使用前必須確定自己已經把握好其功能範圍,否則,級聯刪除和級聯更新可能讓你的資料莫名其妙的被修改或者丟失。從效能看級聯刪除和級聯更新是比其他方法更高效的方法。

字段資料型別設計原則:

a、資料型別盡量用數字型,數字型的比較比字元型的快很多,尤其是作為主鍵。

b、 資料型別盡量小,這裡的盡量小是指在滿足可以預見的未來需求的前提下的,節省乙個位元組是乙個位元組,雖然硬碟便宜也不能浪費啊。

c、 盡量不要允許null,除非必要,可以用not null+default代替。

為什麼最好不要為null呢,因為在程式處理過程中,你經常要為null值進行處理,比如使用isnull進行判斷,這樣削弱查詢的速度,還有程式中需要不斷的為null值進行判斷,多寫了**,減少了程式的效能.

d、少用text和image,二進位製字段的讀寫是比較慢的,而且,讀取的方法也不多,大部分情況下最好不用。在sqlserver 2005盡可能使用nvarchar(max),或者varchar(max);除非必要盡量上傳到伺服器,資料庫保留上傳位址.

e、 自增字段要慎用

1.不利於資料遷移.

2.不利於分布式部署.

3.無法預知id,為子表資料插入造成困難.

4.沒有實際意義,無法讓人看出這個數字到底有什麼用.

f、盡可能使用定長資料型別,而不是變長資料型別

為什麼不要設計過多的變長型別的資料呢?

1.對於 sql server 為說,變長型別的資料,在更新的時候,如果長度比以前的大,會進行頁拆分。會對查詢效能造成嚴重的影響。會增加查詢時,o/i 的花費 (cost) 頁分隔越多,查詢時,o/i 的開銷就越大。對於變長的字段來說,有可能,這個字元的內容,儲存在不同的位置。這個欄位的內容,儲存在不同的位置。儲存在不同的頁中, 它們之間有指標來關聯。這種情況會造成查詢時,磁頭來回定址,定位。可能你查一條記錄,磁頭找這條記錄的這個變長字段的內容,都要去好幾個頁裡找,才能完整的找到。這樣,就造成了很大個 o/i 開銷,降低了查詢效能。從物理上來說,檔案本來就經常容易產生碎片。再加上變長型別的頁拆分。

頁是sql server儲存資料的基本單位,大小為8kb,可以儲存表資料、索引資料、執行計畫資料、分配位圖、可用空間資訊。頁是sql server可以讀寫的最小i/o單位。即便是讀取一行資料,它也要把整個頁載入到快取並從快取中讀取資料。

頁拆分是這樣產生的:

比如:有乙個變長型別的字段 content: nvarchar(512).你新增一條記錄,給 content 的值是 n'abc',那麼,儲存的時候,直接就儲存 n'abc' 了。當你下次 update 這條記錄的 content 欄位時,給的值是 n'abcdef'那麼 就會發生頁拆分。def 對被儲存在其它頁。因為有可能上一次分配的資料頁已經儲存了其他行的資料對吧,對,512  ,只是用來限制這個欄位的長度。並不與頁拆分有關係。記錄的物理順序,與你 insert 的順序是一致。你 insert 了 n條,然後再去修改 第一條,這時候可能不在同乙個頁了.

以上結論就是把變長字段的內容加大,就會造成頁拆分了。也就 是說可變長型別是把一頁填滿,再填另一,影響比較大的是,每次insert的時候會增加分配資料頁得次數

當然有可能造成一行資料儲存在2個資料頁裡.但是,同樣,不但頁拆分對增加查詢時的 o/i 開銷,字元不必要的太長,也會增加 o/i 開銷。

2. 字段大小對錶總大小有影響

sql server 2005單行字段總長是8060位元組

3. 可變長型別是有長度限制的

以上內容是第一篇,請大家多多發表意見!

資料庫優化 資料庫設計優化

一 索引優化 1.首先索引不是越多越好,要視情況而定。因為索引會降低insert和update的效率 insert和update有時可能會重建索引。2.乙個表的索參數量最好不要超過6個,擇優而建。3.專案上線後,根據使用者的查詢條件字段稍微調整資料庫中的字段索引。二 分表 1.縱切 根據表字段來且分...

優化資料庫設計

資料庫設計步驟 1.需求分析 1.收集資訊 2.標識實體 1.標識實體的屬性 2.標識實體的關係 2.繪製e r圖 e 實體r 關係 3.繪製資料庫模型圖 4.根據sql行程資料庫 第一 二 三正規化 1 第一正規化 1nf 無重複的列 所謂第一正規化 1nf 是指資料庫表的每一列都是不可分割的基本...

資料庫優化(理論篇)

資料庫事務的四個特性 acid 1.原子性 2.一致性 3.隔離性 4.永續性 1,關係型資料庫 是建立在關聯式資料庫模型基礎上的資料庫,借助於關係代數等概念和方法來處理資料庫中的資料,同時也是乙個被組織成一組擁有正式描述性的 該 的 作用實質是裝載著資料項的特殊收集體,這些 中的資料能以許多不同的...