gb2312學習筆記

2022-05-03 01:48:10 字數 455 閱讀 7822

1,gb 2312中對所收漢字進行了「分割槽」處理,每區含有94個漢字/符號。

01-09區為特殊符號。

16-55區為一級漢字,按拼音排序。

56-87區為二級漢字,按部首/筆畫排序。

10-15區及88-94區則未有編碼。

舉例來說,「啊」字是gb2312之中的第乙個漢字,它的區位碼就是1601。

2,在使用gb2312的程式通常採用euc儲存方法(euc-cn)

每個漢字及符號以兩個位元組來表示。第乙個位元組稱為「高位位元組」,第二個位元組稱為「低位位元組」。

「高位位元組」使用了0xa1-0xf7(把01-87區的區號加上0xa0),「低位位元組」使用了0xa1-0xfe(把01-94加上0xa0)。 由於一級漢字從16區起始,漢字區的「高位位元組」的範圍是0xb0-0xf7,「低位位元組」的範圍是a1-0xfe,占用的碼位是 72*94=6768。其中有5個空位是d7fa-d7fe。

GB2312編碼範圍

gb2312編碼範圍 a1a1 fefe,其中漢字編碼範圍 b0a1 f7fe。gb2312編碼是第乙個漢字編碼國家標準,由中國國家標準總局1980年發布,1981年5月1日開始使用。gb2312編碼共收錄漢字6763個,其中一級漢字3755個,二級漢字3008個。同時,gb2312編碼收錄了包括拉...

編碼學習整理(二) GB2312

gb 2312或gb 2312 80是乙個簡體中文 字符集的中國國家標準,全稱為 資訊交換用漢字編碼字符集 基本集 又稱為gb0,由中國國家標準總局發布,1981年 5月1日實施。gb2312編碼通行於中國大陸 新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟體都支援gb 2312。g...

終端VI支援gb2312

修改.vimrc檔案,讓其支援 gb2312就行 設定檔案編碼型別,徹底解決中文編碼問題 let termencoding encoding set fileencodings utf 8,gbk,ucs bom,cp936 略微查了一下.vimrc中新增內容的含意,這篇文章有相關解釋。內容如下 v...