關於GBK GB2312 UTF8之間的區別

2021-09-02 13:23:14 字數 877 閱讀 2362

utf-8:unicode transformation format-8bit,允許含bom,但通常不含bom。是用以解決國際上字元的一種多字

節編碼,它對英文使用8位(即乙個位元組),中文使用24為(三個位元組)來編碼。utf-8包含全世界所有國家需要用到的字

符,是國際編碼,通用性強。utf-8編碼的文字可以在各國支援utf8字符集的瀏覽器上顯示。如,如果是utf8編碼,則在

gbk是國家標準gb2312基礎上擴容後相容gb2312的標準。gbk的文字編碼是用雙位元組來表示的,即不論中、英文本元

均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。gbk包含全部中文字元,是國家編碼,通用性比utf8差,

不過utf8占用的資料庫比gbk大。

gbk、gb2312等與utf8之間都必須通過unicode編碼才能相互轉換:

gbk、gb2312--unicode--utf8

utf8--unicode--gbk、gb2312

對於乙個**、論壇來說,如果英文本元較多,則建議使用utf-8節省空間。不過現在很多論壇的外掛程式一般只支援gbk。

gb2312是gbk的子集,gbk是gb18030的子集

gbk是包括中日韓字元的大字符集合

為了避免所有亂碼問題,應該採用utf-8,將來要支援國際化也非常方便

utf-8可以看作是大字符集,它包含了大部分文字的編碼。

使用utf-8的乙個好處是其他地區的使用者(如香港台灣)無需安裝簡體中文支援就能正常**你的文字而不會出現亂碼。

gb2312是簡體中文的碼

gbk支援簡體中文及正體中文

big5支援正體中文

utf-8支援幾乎所有字元

中文內容多的站點可以考慮用gbk或gb2312,英文內容多的站點還是utf-8好

GBK GB2312和UTF 8編碼區分

gbk包含全部中文字元,gbk的文字編碼是雙位元組來表示的,即不論中 英文本元均使用雙位元組來表示,只不過為區分中文,將其最高位都定成1。至於utf 8編碼則是用以 解決國際上字元的一種多位元組編碼,它對英文使用8位 即乙個位元組 中文使用24位 三個位元組 來編碼。對於英文本元較多的 論壇則用ut...

gb2312和UTF 8的區別

gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字更多,...

GB2312 和 UTF 8的區別

本文 gb2312編碼大約包含6000多漢字 不包括特殊字元 編碼範圍為第一位b0 f7,第二位編碼範圍為a1 fe 第一位為cf時,第二位為a1 d3 計算一下漢字個數為6762個漢字。當然還有其他的字元。包括控制鍵和其他字元大約7573個字元編碼 gbk編碼是對gb2312編碼的擴充,容納的漢字...