漢字unicode編碼範圍

2021-07-31 11:25:40 字數 1303 閱讀 2367



gb2312編碼:2023年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。

big5編碼:台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,2023年實施。

gbk編碼:2023年12月發布的漢字編碼國家標準,是對gb2312編碼的擴充,對漢字採用雙位元組編碼。gbk字符集共收錄21003個漢字,包含國家標準gb13000-1中的全部中日韓漢字,和big5編碼中的所有漢字。

gb18030編碼:2023年3月17日發布的漢字編碼國家標準,是對gbk編碼的擴充,覆蓋中文、日文、朝鮮語和中國少數民族文字,其中收錄27484個漢字。gb18030字符集採用單位元組、雙位元組和四位元組三種方式對字元編碼。相容gbk和gb2312字符集。

unicode編碼:國際標準字符集,它將世界各種語言的每個字元定義乙個唯一的編碼,以滿足跨語言、跨平台的文字資訊轉換。

一般使用2w基本漢字就夠了

字符集字數unicode 編碼

基本漢字

20902字

4e00-9fa5

基本漢字補充

38字9fa6-9fcb

擴充套件a6582字

3400-4db5

擴充套件b42711字

20000-2a6d6

擴充套件c4149字

2a700-2b734

擴充套件d222字

2b740-2b81d

康熙部首

214字

2f00-2fd5

部首擴充套件

115字

2e80-2ef3

相容漢字

477字

f900-fad9

相容擴充套件

542字

2f800-2fa1d

pua(gbk)部件

81字e815-e86f

部件擴充套件

452字

e400-e5e8

pua增補

207字

e600-e6cf

漢字筆畫

36字31c0-31e3

漢字結構

12字2ff0-2ffb

漢語注音

22字3105-3120

注音擴充套件

22字31a0-31ba〇1字

3007

漢字unicode編碼範圍

gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...

Unicode 漢字編碼表

1 unicode編碼表 unicode只有乙個字符集,中 日 韓的三種文字占用了unicode中0x3000到0x9fff的部分 unicode目前普遍採用的是ucs 2,它用兩個位元組來編碼乙個字元,比如漢字 經 的編碼是0x7ecf,注意字元編碼一般用十六進製制來 表示,為了與十進位制區分,十...

中文在unicode中的編碼範圍

以前寫過一篇貼子是寫中文在unicode中的編碼範圍unicode中文範圍 但寫的不是很詳細,今天再次研究了下unicode,並給出詳細的unicode取值範圍。本次研究的unicode物件是unicode 5.2.0版本。現在最新的是6.0版 對於這次研究的unicode把編碼分為以下幾個平面 英...