中文字符集

2021-06-23 10:09:10 字數 628 閱讀 6278

gb2312(2023年):16位字符集,收錄有6763個簡體漢字,682個符號,共7445個字元。

優點:適用於簡體中文環境,屬於中國國家標準,通行於大陸,新加坡等地也使用此編碼; 

缺點:不相容正體中文,其漢字集合過少。 

gbk(2023年):16位字符集,收錄有21003個漢字,883個符號,共21886個字元。

優點:適用於簡繁中文共存的環境,為簡體windows所使用(**頁cp936),向下完全相容gb2312,向上支援 iso-10646 國際標準 ;所有字元都可以一對一對映到unicode2.0上。

缺點:不屬於官方標準,和big5之間需要轉換;很多搜尋引擎都不能很好地支援gbk漢字。

gb18030(2023年):32位字符集;收錄了27484個漢字,同時收錄了藏文、蒙文、維吾爾文等主要的少數民族文字。 

優點:可以收錄所有你能想到的文字和符號,屬於中國最新的國家標準;

缺點:目前支援它的字型檔較少。

big5(1992):big5收錄13461個漢字和符號,通行於台灣、香港地區的乙個繁體字編碼方案,big5是台灣資訊工業策進會根據以上標準制定的編碼方案。big5碼是雙位元組編碼方案,其中第乙個位元組的值在oxao-oxfe之間,第二個位元組在ox40-ox7e和oxa1-oxfe之間。

設定中文字符集

目錄 二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符...

mysql中文字符集問題

mysql分為客戶端,伺服器端!客戶端的字符集gbk 這是不可變的 而伺服器端能識別基本所有的字符集 這麼多種字符集!為了避免中文亂碼的問題 我們可以告訴伺服器端 我們的客服端是什麼字符集!set character set client gbk 而且還要告訴伺服器返回的資料的字符集是什麼?set ...

Qt學習筆記 中文字符集

中文字符集 gb2312 中文簡體國標碼 漢字數 6763 gbk 擴充套件中文gb編碼 相容gb2312 漢字 2個位元組 英文本母或半形標點 1個位元組 gb18030 用1 4個位元組編碼,容量超大 big5 中文繁體編碼 cjk 中日韓大字符集編碼 unicode 統一碼,用0 0x10ff...