unicode 編碼雜記

2021-06-03 11:05:15 字數 519 閱讀 7145

unicode,統一碼,可包含世界上所有國家的字元,每乙個字元用兩個位元組表示!

utf-16, 基本上就是unicode雙位元組編碼方式的實現,再加上乙個未來擴充套件需求的編碼機制

utf-8,unicode的不等幅編碼機制,英文保持不變,其他用兩個或三個位元組表示,如中文用三個位元組表示

ucs-2,大體上可考慮成utf-16,

ucs-4, 用4個位元組表示,在utf-16編碼前面加上兩個空白的bytes,

utf-8 編碼原理參看附圖:

utf-16 的擴充套件機制(**對):

保留編碼範圍:d800 ----dbff(高部)

dc00 ---dfff(底部)

兩部分組合用來表示乙個字元共可表示1024*1024個字元

私有區:

共三塊私有區:

e000 ----------------f8ff

**對私有區:

f0000 --------------ffffd

100000 ------------10fffd

字元編碼 unicode編碼

1.ascii american standard code for information interchange 美國資訊交換標準 這是計算機上最早使用的通用的編碼方案。那個時候計算機還只是拉丁文本的專利,根本沒有想到現在計算機的發展勢頭,如果想到了,可能一開始就會使用unicode了。當時絕大...

雜記 Unicode字符集

unicode是字符集,但是微軟在windows上把unicode視為utf 16,即乙個字元佔2個位元組16位。utf 16是unicode的一種編碼規則,與此同時還有utf 8 utf 32。utf 8將一些字元編碼為1個位元組,一些字元編碼為2個位元組,一些字元編碼為3個位元組,一些字元編碼為...

UNICODE編碼問題

unicode編碼問題 今天在eclipse裡面看jode jad class反編譯出來的 發現漢字都用unicode標示,理解起來非常不方便,例如 u65b0 u95fb u680f u76ee u8bbe u7f6e 就是漢字 新聞欄目設定 為了察看方便,特寫一段vb 來快速轉換 public ...