什麼是字符集

2021-08-04 03:20:10 字數 673 閱讀 9873

在介紹字符集之前,我們先了解下為什麼要有字符集。我們在計算機螢幕上看到的是實體化的文字,而在計算機儲存介質中存放的實際是二進位制的位元流。那 麼在這兩者之間的轉換規則就需要乙個統一的標準,否則把我們的u盤插到老闆的電腦上,文件就亂碼了;小夥伴qq上傳過來的檔案,在我們本地開啟又亂碼了。 於是為了實現轉換標準,各種字符集標準就出現了。簡單的說字符集就規定了某個文字對應的二進位制數字存放方式(編碼)和某串二進位制數值代表了哪個文字(解 碼)的轉換關係。

那麼為什麼會有那麼多字符集標準呢?這個問題實際非常容易回答。問問自己為什麼我們的插頭拿到英國就不能用了呢?為什麼顯示器同時有 dvi,vga,hdmi,dp這麼多介面呢?很多規範和標準在最初制定時並不會意識到這將會是以後全球普適的準則,或者處於組織本身利益就想從本質上區 別於現有標準。於是,就產生了那麼多具有相同效果但又不相互相容的標準了。

說了那麼多我們來看乙個實際例子,下面就是屌這個字在各種編碼下的十六進製制和二進位制編碼結果,怎麼樣有沒有一種很屌的感覺?

字符集16進製制編碼

對應的二進位制資料

utf-8

0xe5b18c

1110 0101 1011 0001 1000 1100

utf-16

0x5c4c

1011 1000 1001 1000

gbk0x8cc5

1000 1100 1100 0101

mysql api 字符集 MySQL字符集

mysql字符集包括字符集 character 和 collation 兩個概念。字符集是用來定義mysql儲存字串的規則,校對規則則是定義了比較字串的方式。字串和校對規則是一對多的 關係。使用命令 show collation like gbk 可檢視相關的校對規則 使用 show charact...

Unicode字符集和多字符集

由於各國語言的加入,ascii已經不能滿足資訊交流的需要,因此,為了能夠表示其它國家的文字,各國在ascii的基礎上制定了自己的字符集,它們正式的名稱應該是mbcs multi byte chactacter system,即多位元組字元系統 型別說明 unicode ansi 通用型別 字元wch...

mysql 集群字符集 Mysql 字符集

字符集與字元比較 字符集字符集是某種字元的集合,比如最常見的ascii碼,由127個字元組成,只需要乙個位元組就能表示 我們常說的字符集還是gbk iso utf8 mysql 我們使用得最多的字符集就是gbk 和 utf8了 他們都是變長字符集,如果字元在ascii範圍內就使用乙個位元組表示,其他...