字符集了解

2021-07-25 15:53:57 字數 834 閱讀 9409

計算機中儲存資訊的最小單元是乙個byte,即8個bite,能表示的範圍只有0~255,所以是無法完全表示人類世界的符號的,

同樣也無法理解人類的各種符號,所以需要一種翻譯的東東即為字元編碼集,幾中字元編碼集如下:

ascii碼:一共有128個,用乙個位元組的低七位表示,0-31是控制字元如換行、回車、刪除等,32-126是列印字元,可以通過

鍵盤輸入並列印出來。

iso-8859-1:128個字元是不夠使的,所以iso組織為擴充套件ascii碼整出來這個東東,涵蓋了大多數西歐語言字元,應用廣泛

,此編碼集仍然是單位元組編碼,總共能表示256個字元。

gb2312:它的全稱是《資訊交換用漢字編碼字符集基本集》,是雙位元組編碼,包含6763個漢字。

gbk:全稱叫《漢字內碼擴充套件規範》是國家技術監督局為windows 95所製字的新漢字內碼規範。此集擴充套件了gb2312,加入了更

多的漢字,能表示21003個漢字,並且相容gb2312。

gb18030:全稱叫《資訊交換用漢字編碼字符集》,是國家強制標準。它可以是單位元組,雙位元組,或者是四位元組編碼,相容

gb2312,雖是國標,但實際應用並不規範。

utf-16:iso組織試圖建立乙個涵蓋世界所有語言的超級詞典,即此集,所以此集挺複雜。此集無論什麼字元均採用定長兩個

位元組來表示,兩個位元組是16bit,所以叫utf-16。此集方便是方便,但許多的字元本來乙個位元組就夠了,但它依然兩個位元組,

所以就造成了許多的浪費,所以。。。。

utf-8:此編碼集同utf-16一樣可以表示所有語言符號,但是utf-8採用了一種變長的技術,不同的字元型別字元可以由1-6個

位元組組成。被普啟蒙支援。

mysql h 字符集 了解MySQL的字符集

在資料庫中,字元亂碼屬於常見 多發問題。鑑於本人水平頂多只能歸於不入流之類,寫這篇文章時內心誠惶誠恐,實在擔心誤導大家。內容僅供參考,若有錯誤,請各位及時指出,我也好學習提高!mysql的字符集有4種級別的設定,分別是 伺服器級 資料庫級 表級 字段級。一 伺服器級字符集 1 可以在my.cnf中設...

mysql api 字符集 MySQL字符集

mysql字符集包括字符集 character 和 collation 兩個概念。字符集是用來定義mysql儲存字串的規則,校對規則則是定義了比較字串的方式。字串和校對規則是一對多的 關係。使用命令 show collation like gbk 可檢視相關的校對規則 使用 show charact...

深入了解字符集和編碼問題

對於字符集,編碼的問題,一直都搞不太明白,下面好好學習一下 一 什麼是字符集?什麼是編碼?一組抽象 可能按某一維度來區分不同的字元,比如按照語言,將字元分類,分為中文字符集 英文字符集 字元的集合就是字符集 charset 它是字元的集合,也可以理解為字元的分類,比如英文字符集 中文字符集等。每種編...