char與varchar型別區別的深度剖析

2021-10-03 03:47:32 字數 3287 閱讀 5651

char和varchar這兩種型別是我們經常使用的型別,在使用的時候大家也沒有特別注意有什麼區別,好奇心驅使我對其進行**,經過查閱一番資料手冊以及做的小測試,有了一定程度的了解,特此記錄下來!

手冊中有提到:char和varchar型別類似,但它們儲存和檢索的方式不同。它們的最大長度和是否尾部空格被保留等方面也不同。在儲存或檢索過程中不進行大小寫轉換。

稍微進一步的解釋:

char和varchar型別宣告長度表示使用者想儲存的最大字元數,其中char(m)定義的列的長度為固定的,m的取值可以0-255之間,當儲存char值時,在它們的右邊填充空格以達到指定的長度。當檢索到char值時,尾部的空格被刪除掉(如下圖)。在儲存或檢索過程中不進行大小寫轉換。char儲存定長資料很方便,char欄位上的索引效率很高。

varchar(m)定義的列的長度是可變長度字串,在mysql5.0以上的版本中,varchar的資料型別長度支援到了65535,因為起始位和結束位占去了3個位元組,所以其整體最大長度為65532位元組(varchar的最大有效長度由最大行大小和使用的字符集確定)。

除此之外,與char比,varchar值儲存時只儲存需要的字元數,另加乙個位元組來記錄長度(長度超過255時需要2個位元組)。

同樣在char和varchar尾部加空格,檢索時char型別後的被刪掉,而varchar型別的儲存。

總結:在mysql資料庫中,用的最多的字元型資料型別就是varchar和char.。這兩種資料型別雖然都是用來存放字元型資料,但是無論從結構還是從資料的儲存方式來看,兩者相差很大。而且其具體的實現方式,還依賴與儲存引擎。這裡就以大家最常用的myisam儲存引擎為例,談談這兩種資料型別的差異。

這裡首先需要明白的一點是,這兩種資料型別,無論採用哪一種儲存引起,系統儲存資料的方式都是不同的。正是因為如此,我們才有必要研究兩者的不同。然後在合適的情況下,採用恰當的方式。

varchar往往用來儲存可變長度的字串。簡單的說,我們只是給其固定了乙個最大值,然後系統會根據實際儲存的資料量來分配合適的儲存空間。為此相比char字元資料而言,其能夠比固定長度型別占用更少的儲存空間。不過在實際工作中,由於某系特殊的原因,會在這裡設定例外。如管理員可以根據需要指定row_format=fixed選項。利用這個選項來建立myisam表的話,系統將會為每一行使用固定長度的空間。此時會造成儲存空間的損耗。通常情況下,varchar資料型別能夠節約磁碟空間,為此往往認為其能夠提公升資料庫的效能。不過這裡需要注意的是,這往往是一把雙刃劍。其在提公升效能的同時,往往也會產生一些***。如因為其長度是可變的,為此在資料進行更新時可能會導致一些額外的工作。如在更改前,其字元長度是10位(varchar規定的最長字元數假設是50位),此時系統就只給其分配10個儲存的位置(假設不考慮系統自身的開銷)。更改後,其資料量達到了20位。由於沒有超過最大50位的限制,為此資料庫還是允許其儲存的。只是其原先的儲存位置已經無法滿足其儲存的需求。此時系統就需要進行額外的操作。如根據儲存引擎不同,有的會採用拆分機制,而有的則會採用分頁機制。

char資料型別與varchar資料型別不同,其採用的是固定長度的儲存方式。簡單的說,就是系統總為其分配最大的儲存空間。當資料儲存時,即使其沒有達到最大的長度,系統也會為其分配這麼多的儲存空間。顯然,這種儲存方式會造成磁碟空間的浪費。這裡筆者需要提醒的一點是,當字元位數不足時,系統並不會採用空格來填充。相反,如果在儲存char值的時候,如果其後面有空值,系統還會自動過濾其空格。而在進行資料比較時,系統又會將空格填充到字串的末尾。

顯然,varchar與char兩種字元型資料型別相比,最大的差異就是前者是可變長度,而後者則是固定長度。在儲存時,前者會根據實際儲存的資料來分配最終的儲存空間。而後者則不管實際儲存資料的長度,都是根據char規定的長度來分配儲存空間。這是否意味著char的資料型別劣於varchar呢?其實不然。否則的話,就沒有必要存在char字元型別了。雖然varchar資料型別可以節省儲存空間,提高資料處理的效率。但是其可變長度帶來的一些負面效應,有時候會抵消其帶來的優勢。為此在某些情況下,還是需要使用char資料型別。

注意:使用varchar資料型別,也不能夠太過於慷慨。這是什麼意思呢?如現在使用者需要儲存乙個位址資訊。根據評估,只要使用100個字元就可以了。但是有些資料庫管理員會認為,反正varchar資料型別是根據實際的需要來分配長度的。還不如給其大一點的呢。為此他們可能會為這個字段一次性分配200個字元的儲存空間。這varchar(100)與varchar(200)真的相同嗎?結果是否定的。雖然他們用來儲存90個字元的資料,其儲存空間相同。但是對於記憶體的消耗是不同的。對於varchar資料型別來說,硬碟上的儲存空間雖然都是根據實際字元長度來分配儲存空間的,但是對於記憶體來說,則不是。其實使用固定大小的記憶體塊來儲存值。簡單的說,就是使用字元型別中定義的長度,即200個字元空間。顯然,這對於排序或者臨時表(這些內容都需要通過記憶體來實現)作業會產生比較大的不利影響。所以如果某些欄位會涉及到檔案排序或者基於磁碟的臨時表時,分配varchar資料型別時仍然不能夠太過於慷慨。還是要評估實際需要的長度,然後選擇乙個最長的字段來設定字元長度。如果為了考慮冗餘,可以留10%左右的字元長度。千萬不能認為其為根據實際長度來分配儲存空間,而隨意的分配長度,或者說乾脆使用最大的字元長度。

適用情況:

1、對於myisam表,盡量使用char,對於那些經常需要修改而容易形成碎片的myisam和isam資料表就更是如此,它的缺點就是占用磁碟空間;

2、對於innodb表,因為它的資料行內部儲存格式對固定長度的資料行和可變長度的資料行不加區分(所有資料行共用乙個表頭部分,這個標頭部分存放著指向各有關資料列的指標),所以使用char型別不見得會比使用varchar型別好。事實上,因為char型別通常要比varchar型別占用更多的空間,所以從減少空間佔用量和減少磁碟i/o的角度,使用varchar型別反而更有利;

3、儲存很短的資訊,比如門牌號碼101,201……這樣很短的資訊應該用char,因為varchar還要占個byte用於儲存首席資訊官度,本來打算節約儲存的現在得不償失。

4、固定長度的。比如使用uuid作為主鍵,那用char應該更合適。因為他固定長度,varchar動態根據長度的特性就消失了,而且還要占個長度資訊。

5、十分頻繁改變的column。因為varchar每次儲存都要有額外的計算,得到長度等工作,如果乙個非常頻繁改變的,那就要有很多的精力用於計算,而這些對於char來說是不需要的。

char和varchar這兩種型別是我們經常使用的型別,在使用的時候大家也沒有特別注意有什麼區別,好奇心驅使我對其進行**,經過查閱一番資料手冊以及做的小測試,有了一定程度的了解,特此記錄下來!

mysql中char與varchar的區別

char是一種固定長度的型別,varchar則是一種可變長度的型別 char m 型別的資料列裡,每個值都占用m個位元組,如果某 個長度小於m,mysql就會在它的右邊用空格字元補足 在檢索操作中那些填補出來的空格字元將被去掉 在varchar m 型別的資料列裡,每個值 只占用剛好夠用的位元組再加...

mysql中char與varchar的區別分析

在mysql教程中char與varchar的區別呢,都是用來儲存字串的,只是他們的儲存方式不一樣罷了,char有固定的長度,而varchar屬於可變長的字元型別。char與varchar的區別 char 13 長度固定,如 www.jb51.net 儲存需要空間 12個字元 varchar 13 可...

mysql中char與varchar的區別分析

char與varchar的區別 char 20 長度固定,如 www.jb51.net 儲存需要空間 20個字元 varchar 20 可變長 如 www.jb51.net 需要儲存空間 12 1 13字元,從上面可以看得出來char 長度是固定的,不管你儲存的資料是多少他都會都固定的長度。而var...