MySQL 的資料型別和建庫策略

2021-04-12 22:06:25 字數 2633 閱讀 9921

無論是在小得可憐的免費資料庫空間或是大型電子商務**,合理的設計表結構、充分利用空間是十分必要的。這就要求我們對資料庫系統的常用資料型別有充分的認識。下面我就將我的一點心得寫出來跟大家分享。

一、數字型別

數字型別按照我的分類方法分為三類:整數類、小數類和數字類。

我所謂的「數字類」,就是指 decimal 和 numeric,它們是同一種型別。它嚴格的說不是一種數字型別,因為他們實際上是將數字以字串形式儲存的;他的值的每一位 (包括小數點) 佔乙個位元組的儲存空間,因此這種型別耗費空間比較大。但是它的乙個突出的優點是小數的位數固定,在運算中不會「失真」,所以比較適合用於「**」、「金額」這樣對精度要求不高但準確度要求非常高的字段。

小數類,即浮點數型別,根據精度的不同,有 float 和 double 兩種。它們的優勢是精確度,float 可以表示絕對值非常小、小到約 1.17e-38 (0.000...0117,小數點後面有 37 個零) 的小數,而 double 更是可以表示絕對值小到約 2.22e-308 (0.000...0222,小數點後面有 307 個零) 的小數。float 型別和 double 型別占用儲存空間分別是 4 位元組和 8 位元組。如果需要用到小數的字段,精度要求不高的,當然用 float 了。可是說句實在話,我們「民用」的資料,哪有要求精度那麼高的呢?這兩種型別至今我沒有用過――我還沒有遇到適合於使用它們的事例。

用的最多的,最值得精打細算的,是整數型別。從只佔乙個位元組儲存空間的 tinyint 到佔 8 個位元組的 bigint,挑選乙個「夠用」並且占用儲存空間最小的型別是設計資料庫時應該考慮的。tinyint、**allint、mediumint、int 和 bigint 占用儲存空間分別為 1 位元組、2 位元組、3 位元組、4 位元組和 8 位元組,就無符號的整數而言,這些型別能表示的最大整數分別為 255、65535、16777215、4294967295 和 18446744073709551615。如果用來儲存使用者的年齡 (舉例來說,資料庫中儲存年齡是不可取的),用 tinyint 就夠了;九城的《縱橫》裡,各項技能值,用 **allint 也夠了;如果要用作乙個肯定不會超過 16000000 行的表的 auto_increment 的 identify 字段,當然用 mediumint 不用 int,試想,每行節約乙個位元組,16000000 行可以節約 10 兆多呢。

二、日期時間型別

日期和時間型別比較簡單,無非是 date、time、datetime、timestamp 和 year 等幾個型別。只對日期敏感,而對時間沒有要求的字段,就用 date 而不用 datetime 是不用說的了;單獨使用時間的情況也時有發生――使用 time;但最多用到的還是用 datetime。在日期時間型別上沒有什麼文章可做,這裡就不再詳述。

三、字元 (串) 型別

不要以為字元型別就是 char,char 和 varchar 的區別在於 char 是固定長度,只要你定義乙個欄位是 char(10),那麼不論你儲存的資料是否達到了 10 個位元組,它都要占去 10 個位元組的空間;而 varchar 則是可變長度的,如果乙個字段可能的值是不固定長度的,我們只知道它不可能超過 10 個字元,把它定義為 varchar(10) 是最合算的,varchar 型別的占用空間是它的值的實際長度 +1。為什麼要 +1 呢?這乙個位元組用於儲存實際使用了多大的長度。從這個 +1 中也應該看到,如果乙個字段,它的可能值最長是 10 個字元,而多數情況下也就是用到了 10 個字元時,用 varchar 就不合算了:因為在多數情況下,實際占用空間是 11 個位元組,比用 char(10) 還多占用乙個位元組。

舉個例子,就是乙個儲存**名稱和**的表,**名稱絕大部分是四個字的,即 8 個位元組;****,上海的是六位數字,深圳的是四位數字。這些都是固定長度的,**名稱當然要用 char(8);****雖然是不固定長度,但如果使用 varchar(6),乙個深圳的****實際占用空間是 5 個位元組,而乙個上海的****要占用 7 個位元組!考慮到上海的**數目比深圳的多,那麼用 varchar(6) 就不如 char(6) 合算了。

雖然乙個 char 或 varchar 的最大長度可以到 255,我認為大於 20 的 char 是幾乎用不到的――很少有大於 20 個位元組長度的固定長度的東東吧?不是固定長度的就用 varchar。大於 100 的 varchar 也是幾乎用不到的――比這更大的用 text 就好了。tinytext,最大長度為 255,占用空間也是實際長度 +1;text,最大長度 65535,占用空間是實際長度 +2;mediumtext,最大長度 16777215,占用空間是實際長度 +3;longtext,最大長度 4294967295,占用空間是實際長度 +4。為什麼 +1、+2、+3、+4?你要是還不知道就該打 pp 了。這些可以用在論壇啊、新聞啊,什麼的,用來儲存文章的正文。根據實際情況的不同,選擇從小到大的不同型別。

四、列舉和集合型別

列舉 (enum) 型別,最多可以定義 65535 種不同的字串從中做出選擇,只能並且必須選擇其中一種,占用儲存空間是乙個或兩個位元組,由列舉值的數目決定;集合 (set) 型別,最多可以有 64 個成員,可以選擇其中的零個到不限定的多個,占用儲存空間是乙個到八個位元組,由集合可能的成員數目決定。

舉個例子來說,在 sqlserver 中,你可以節約到用乙個 bit 型別來表示性別 (男/女),但 mysql 沒有 bit,用 tintint 嗎?不,可以用 enum('帥哥','美眉'),只有兩種選擇,所以只需乙個位元組――跟 tinyint 一樣大,但卻可以直接用字串 '帥哥' 和 '美眉' 來訪問。真是太方便啦!

MySQL 的資料型別和建庫策略

無論是在小得可憐的免費資料庫空間或是大型電子商務 合理的設計表結構 充分利用空間是十分必要的。這就要求我們對資料庫系統的常用資料型別有充分的認識。下面我就將我的一點心得寫出來跟大家分享。一 數字型別 數字型別按照我的分類方法分為三類 整數類 小數類和數字類。我所謂的 數字類 就是指 decimal ...

MySQL的資料型別和建庫策略

無論是在小得可憐的免費資料庫空間或是大型電子商務 合理的設計表結構 充分利用空間是十分必要的。這就要求我們對資料庫系統的常用資料型別有充分的認識。下面我就將我的一點心得寫出來跟大家分享。一 數字型別。數字型別按照我的分類方法分為三類 整數類 小數類和數字類。我所謂的 數字類 就是指decimal和n...

MySQL的資料型別和建庫策略詳解

一 數字型別。數字型別按照我的分類方法分為三類 整數類 小數類和數字類。我所謂的 數字類 就是指decimal和numeric,它們是同一種型別。它嚴格的說不是一種數字型別,因為他們實際上是將數字以字串形式儲存的 他的值的每一位 包括小數點 佔乙個位元組的儲存空間,因此這種型別耗費空間比較大。但是它...