關於漢字與Ascii碼

2021-07-06 02:17:36 字數 1932 閱讀 7702

gb2312和gbk每乙個漢字由2個位元組組成,這2個位元組的ascii碼大小分別是:

gb2312:

high8 = 0xa1-->0xfe (161 - 254)

low8 = 0xa1-->0xfe  (161 - 254)

gbk:

high8 = 0x80-->0xfe (128 - 254)

low8 = 0x40-->0xfe (64 - 254)

gb2312和gbk的區別:

gbk: 漢字國標擴充套件碼,基本上採用了原來gb2312-80所有的漢字及碼位,並涵蓋了原unicode中所有的漢字20902,總共收錄了883個符號, 21003個漢字及提供了1894個造字碼位。 microsoft簡體版中文windows 95就是以gbk為內碼,又由於gbk同時也涵蓋了unicode所有cjk漢字,所以也可以和unicode做一一對應。

gb碼,全稱是gb2312-80《資訊交換用漢字編碼字符集 基本集》,2023年發布,是中文資訊處理的國家標準,在大陸及海外使用簡體中文的地區(如新加坡等)是強制使用的唯一中文編碼。p-windows3.2和蘋果os就是以gb2312為基本漢字編碼, windows 95/98則以gbk為基本漢字編碼、但相容支援gb2312。gb碼共收錄6763個簡體漢字、682個符號,其中漢字部分:一級字3755,以拼音排序,二級字3008,以偏旁排序。該標準的制定和應用為規範、推動中文資訊化程序起了很大作用。

gbk編碼是中國大陸制訂的、等同於ucs的新的中文編碼擴充套件國家標準。gbk工作小組於2023年10月,同年12月完成gbk規範。該編碼標準相容gb2312,共收錄漢字21003個、符號883個,並提供1894個造字碼位,簡、繁體字融於一庫。

漢字ascii對照表的列印方法:

// 列印ascii漢字編碼表 

for(int i =  129; i < 256; ++i) //  129 = 0x81   

}  知道乙個漢字,輸出其ascii碼:

//  知道乙個漢字,獲取其ascii編碼 

char * pchar = "中";  

//需要先把pchar的每個字元轉成unsigned char, 

// 直接用int i = pchar[0],得到的是負值 

unsigned char ci = pchar[0];   

int i = ci;  

unsigned char cj = pchar[1];  

int j = cj;  

cout << pchar << " "

<< i << ","

<< j << endl;  

// 輸出214,208

知道漢字的ascii碼,輸出漢字:

//  知道漢字的ascii碼輸出漢字 

char pchar[3];  

pchar[0] = 214;  

pchar[1] = 208;  

pchar[2] = '/0';  

cout << pchar << endl; 

應用,去除檔案中除漢字、字母、數字以外的字元:

// 去除檔案中除漢字、字母、數字以外的字元 

// 檔案必須是ansi編碼 

cstring sfile = readlocalfile(sname);  

char * ptemp = sfile.getbuffer();  

cstring stowrite = "";  

for(int i = 0; i < strlen(ptemp); ++i)  

// 此時(ch < 0)兩個char表示乙個漢字,所以跳過第二個char 

++i;      

}  else

if( (ch >= 97 && ch <= 122) || (ch >= 48 && ch <= 57))  

}  writelocalfile(stowrite, rname);  

關於ASCII和漢字的轉換

private void button1 click object sender,eventargs e textbox2.text add 簡單的轉換 轉換後的數每乙個都加空格來區分 private void button1 click object sender,eventargs e stri...

ascii碼01100001 ASCII碼對照表

ascii 碼對照表 bindec hex縮寫 字元解釋 nul null 空字元soh start of handing 標題開始 stx start of text 正文開始 etx end of text 正文結束 eot end of transmission 傳輸結束 enq enquir...

python 漢字與ASCII互相轉換

一 段 python ascii轉漢字 name r u5f20 u5357 u74dc print name.encode ascii decode unicode escape python 漢字轉ascii name1 張南瓜 print name1.encode unicode escape...