郵件標題資訊GB2312中文亂碼問題

2021-10-25 03:24:58 字數 846 閱讀 2455

郵件的標題為:測試家意專家

取到的頭資訊為:subject:=?gb2312?b?pz+80tlip7zs?=

通過getsubject方法取到的字串繁體亂碼:類似於??家意?家

頭資訊的含義為:subject:=?chartset?encoding?word?=,即上文中的標題是gb2312編碼,base64加密

繁體亂碼的原因是:gb2312不支援繁體,但標題中就是有繁體

string str=

"測試家意專家"

;string test=base64encoder.

encode

(str.

getbytes

("gb2312"))

;//"pz+80tlip7zs"

//測試:先解密,再用gbk編碼

string result1=

newstring

(base64decoder.

decodebuffer

(test)

,"gbk");

// result1 : ??家意?家

ascii碼63 就是 「?」,也就是說繁體字在被gb2312解碼時,因為無法識別,全部設為?,無法被還原。

所以雖然頭資訊中寫的gb2312,實際可能用的是gbk

//1.測試2
把mail包中的 getsubject()及相關的方法cv複製下來,然後加個判斷如果編碼是gb2312就換成gbk。

gb2312學習筆記

1,gb 2312中對所收漢字進行了 分割槽 處理,每區含有94個漢字 符號。01 09區為特殊符號。16 55區為一級漢字,按拼音排序。56 87區為二級漢字,按部首 筆畫排序。10 15區及88 94區則未有編碼。舉例來說,啊 字是gb2312之中的第乙個漢字,它的區位碼就是1601。2,在使用...

GB2312編碼範圍

gb2312編碼範圍 a1a1 fefe,其中漢字編碼範圍 b0a1 f7fe。gb2312編碼是第乙個漢字編碼國家標準,由中國國家標準總局1980年發布,1981年5月1日開始使用。gb2312編碼共收錄漢字6763個,其中一級漢字3755個,二級漢字3008個。同時,gb2312編碼收錄了包括拉...

列舉GB2312中的漢字

build gcc g gb.c o gb.exe characters in gb2312 are divided into codepoints,with each codepoint comprising 94 glyphs characters.the codepoints can be d...