有了VARCHAR,為什麼還要有CHAR?

2022-03-12 09:18:19 字數 1912 閱讀 2135

varchar

varchar往往用來儲存可變長度的字串。簡單的說,我們只是給其固定了乙個最大值,然後系統會根據實際儲存的資料量來分配合適的儲存空間。為此相比char字元資料而言,其能夠比固定長度型別占用更少的儲存空間。

因為其長度是可變的,為此在資料進行更新時可能會導致一些額外的工作。如在更改前,其字元長度是10位(varchar規定的最長字元數假設是50位),此時系統就只給其分配10個儲存的位置(假設不考慮系統自身的開銷)。更改後,其資料量達到了20位。由於沒有超過最大50位的限制,為此資料庫還是允許其儲存的。只是其原先的儲存位置已經無法滿足其儲存的需求。此時系統就需要進行額外的操作。如根據儲存引擎不同,有的會採用拆分機制,而有的則會採用分頁機制。更改資料耗時耗資源,造成資料碎片。

char

char採用的是固定長度的儲存方式。簡單的說,就是系統總為其分配最大的儲存空間。當資料儲存時,即使其沒有達到最大的長度,系統也會為其分配這麼多的儲存空間。顯然,這種儲存方式會造成磁碟空間的浪費。

varchar vs char

我們在評估到底是使用varchar資料型別還是採用char資料型別時,就需要進行均衡。在實際專案中,我們會考量如下情況。

一是根據字元的長度來判斷。如某個字段,像人的名字,其最長的長度也是有限的。如我們給其分配18個字元長度即可。此時雖然每個人的名字長度有可能不同,但是即使為其分配了固定長度的字元型別,即18個字元長度,最後浪費的空間也不是很大。而如果採用nvarchar資料型別時,萬一以後需要改名,而原先的儲存空間不足用來容納新的值,反而會造成一些額外的工作。在這種情況下,進行均衡時,會認為採用char固定長度的資料型別更好。在實際專案中,如果某個欄位的字元長度比較短此時一般是採用固定字元長度。

二是考慮其長度的是否相近。如果某個欄位其長度雖然比較長,但是其長度總是近似的,如一般在90個到100個字元之間,甚至是相同的長度。此時比較適合採用char字元型別。比較典型的應用就是md5雜湊值。當利用md5雜湊值來儲存使用者密碼時,就非常使用採用char字元型別。因為其長度是相同的。另外,像用來儲存使用者的身份證號碼等等,一般也建議使用char型別的資料。

另外請大家考慮乙個問題,char(1)與varchar(1)兩這個定義,會有什麼區別呢?雖然這兩個都只能夠用來儲存單個的字元,但是varchar要比char多占用乙個儲存位置。這主要是因為使用varchar資料型別時,會多用1個位元組用來儲存長度資訊。這個管理上的開銷char字元型別是沒有的。

三是從碎片角度進行考慮。使用char字元型時,由於儲存空間都是一次性分配的。為此某個欄位的內容,其都是儲存在一起的。單從這個角度來講,其不存在碎片的困擾。而可變長度的字元資料型別,其儲存的長度是可變的。當其更改前後資料長度不一致時,就不可避免的會出現碎片的問題。故使用可變長度的字元型資料時,資料庫管理員要時不時的對碎片進行整理。如執行資料庫匯出匯入作業,來消除碎片。

四是即使使用varchar資料型別,也不能夠太過於慷慨。這是什麼意思呢?如現在使用者需要儲存乙個位址資訊。根據評估,只要使用100個字元就可以了。但是有些資料庫管理員會認為,反正varchar資料型別是根據實際的需要來分配長度的。還不如給其大一點的呢。為此他們可能會為這個字段一次性分配200個字元的儲存空間。這varchar(100)與varchar(200)真的相同嗎?結果是否定的。雖然他們用來儲存90個字元的資料,其儲存空間相同。但是對於記憶體的消耗是不同的。對於varchar資料型別來說,硬碟上的儲存空間雖然都是根據實際字元長度來分配儲存空間的,但是對於記憶體來說,則不是。其時使用固定大小的記憶體塊來儲存值。簡單的說,就是使用字元型別中定義的長度,即200個字元空間。顯然,這對於排序或者臨時表(這些內容都需要通過記憶體來實現)作業會產生比較大的不利影響。所以如果某些欄位會涉及到檔案排序或者基於磁碟的臨時表時,分配varchar資料型別時仍然不能夠太過於慷慨。還是要評估實際需要的長度,然後選擇乙個最長的字段來設定字元長度。如果為了考慮冗餘,可以留10%左右的字元長度。千萬不能認為其為根據實際長度來分配儲存空間,而隨意的分配長度,或者說乾脆使用最大的字元長度。

**自:

有了網段為什麼還要有VLAN???

近幾日,在學習vlan及vxlan方面的知識,對於產生原因做乙個總結及詳解。vlan virtual local area network,虛擬區域網 其主要用途是用來縮小廣播域,即進行隔離。先對廣播域的乙個概念做如下描繪 如下圖,主機a b c d均連線在交換機sw1上,其中a c同網段為192....

為什麼有了binlog還要有redo log

binlog會記錄所有與mysql資料庫有關的日誌記錄,包括innodb,myisam,heap等其他儲存引起的日誌。而redo log只記錄innodb引擎本身的日誌。binlog記錄的是關於乙個事務的具體操作內容,即該日誌是邏輯日誌。而redolog記錄的是關於每個頁的更改的物理情況。寫入時間不...

為什麼有了foreach還要有迭代器?

foreach就是基於迭代器實現的 foreach需要知道自己的集合型別,甚至要知道自己集合內的元素型別,不能實現多型。這個使用的語法上都可以表示出來。foreach可以遍歷任何集合或者陣列,但是使用者需要知道遍歷元素的型別。iterator是乙個介面累心,它不關心集合的累心和集合內的元素型別,因為...