GB2312編碼範圍

2022-07-15 06:03:09 字數 993 閱讀 4076

gb2312編碼範圍:a1a1-fefe,其中漢字編碼範圍:b0a1-f7fe。

gb2312編碼是第乙個漢字編碼國家標準,由中國國家標準總局2023年發布,2023年5月1日開始使用。gb2312編碼共收錄漢字6763個,其中一級漢字3755個,二級漢字3008個。同時,gb2312編碼收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內的682個全形字符。

分割槽表示

gb2312編碼對所收錄字元進行了「分割槽」處理,共94個區,每區含有94個位,共8836個碼位。這種表示方式也稱為區位碼。

01-09區收錄除漢字外的682個字元。

10-15區為空白區,沒有使用。

16-55區收錄3755個一級漢字,按拼音排序。

56-87區收錄3008個二級漢字,按部首/筆畫排序。

88-94區為空白區,沒有使用。

舉例來說,「啊」字是gb2312編碼中的第乙個漢字,它位於16區的01位,所以它的區位碼就是1601。

雙位元組編碼

gb2312規定對收錄的每個字元採用兩個位元組表示,第乙個位元組為「高位元組」,對應94個區;第二個位元組為「低位元組」,對應94個位。所以它的區位碼範圍是:0101-9494。區號和位號分別加上0xa0就是gb2312編碼。例如最後乙個碼位是9494,區號和位號分別轉換成十六進製制是5e5e,0x5e+0xa0=0xfe,所以該碼位的gb2312編碼是fefe。

gb2312編碼範圍:a1a1-fefe,其中漢字的編碼範圍為b0a1-f7fe,第一位元組0xb0-0xf7(對應區號:16-87),第二個位元組0xa1-0xfe(對應位號:01-94)。

若要查詢具體字元的編碼請前往:漢字字符集編碼查詢。

gb2312編碼表

中華人民共和國國家標準

資訊交換用漢字編碼字符集

基 本 集

gb 2312-80

GB2312的編碼規則

gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假名及片假名字母 俄羅斯語西里爾字母在內的682個全形字符。gb2312的出現,基本滿足了漢字的計算機處理需要,它所收錄的漢字已經覆蓋99.75 的使用頻率。gb2...

編碼學習整理(二) GB2312

gb 2312或gb 2312 80是乙個簡體中文 字符集的中國國家標準,全稱為 資訊交換用漢字編碼字符集 基本集 又稱為gb0,由中國國家標準總局發布,1981年 5月1日實施。gb2312編碼通行於中國大陸 新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟體都支援gb 2312。g...

關於gb2312編碼的xml解析

在ios專案中遇到這樣乙個問題,需要讀取遠端的xml檔案,進行解析,但是目標xml是gb2312編碼的,用system.text.encoding.getencoding gb2312 並不奏效。提示 encoding name gb2312 not supported 查了下才知道getencod...