列舉GB2312中的漢字

2021-04-01 20:45:52 字數 963 閱讀 8399

//build gcc -g gb.c -o gb.exe //

//characters in gb2312 are divided into codepoints, with each codepoint comprising 94 glyphs/characters. //

//the codepoints can be divided and categorised as:

//    * 01-09, comprising punctuation and other special characters.

//    * 16-55, the first plane for chinese characters, arranged according to pinyin.

//    * 56-87, the second plane for chinese characters, arranged according to radical and strokes. //

//the codepoints 10-15 and 88-94 are unassigned. //

//

#include

<

stdio

.h>

static

void

dumprange

(file

* fp

, unsigned

shortn)

fflush(fp

);

return;

}

static

void

dumpgb2312

(void)

else

return

;      

}

intmain

(int

argc

, char

* argv)

GB2312的編碼規則

gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假名及片假名字母 俄羅斯語西裡爾字母在內的682個全形字元。gb2312的出現,基本滿足了漢字的計算機處理需要,它所收錄的漢字已經覆蓋99.75 的使用頻率。gb2...

根據GB2312漢字區位碼獲取漢字拼音的工具類

size x large 申明 本工具類的原型來自網際網路,本人作了演算法上的調整。所以嚴格上不算原創,只能算是編著。主要思路 根據gb2312漢字的區位碼,建立區位碼與拼音的對應關係,因為一定範圍內的漢字區位碼的拼音是一樣的,例如,如果漢字的區位碼在 20317,20319 範圍內,那麼其拼音為 ...

Java之將GB2312編碼轉化為漢字

本文實現將gb2312編碼轉換成漢字,並簡單瞭解一下gb2312編碼。gb2312是資訊交換漢字編碼字符集,適用於漢字處理 漢字通訊等系統之間的資訊交換,通行於中國大陸。使用區位碼錶示方式,對所收漢字進行了 分割槽 處理,每區含有94個漢字 符號。注 將gb2312編碼轉化為漢字方法 string ...

php輸出全部gb2312編碼內的漢字方法

php輸出全部gb2312編碼內的漢字,area表示分割槽,pos表示分割槽內所在位置。for area 0xb0 area 0xf7 ar程式設計客棧ea 程式設計客棧 for pos 0xa1 pos 程式設計客棧0xfe pos fwritiudadolle fp,pack cc area,p...

字符集GB2312的理解

在計算機程式中,通常都有涉及到gbk,gb2312編碼方式的問題。常見的是網頁開啟是亂碼啊,api之間傳輸的是亂碼字元啊等等。我們都知道,在計算機程式中,所有的資訊都是以01來表示的,之所以編碼是人類需要和計算機溝通。例如,人類要將一個漢字如 啊 儲存在計算機中,如果採用gb2312編碼儲存的話,啊...