Unicode原理和互轉中文

2022-02-03 16:05:10 字數 721 閱讀 7113

**點

unicode標準的本意很簡單:希望給世界上每一種文字系統的每乙個字元,都分配乙個唯一的整數,這些整數叫做**點(code points)。

**空間

所有的**點構成乙個**空間(code space),根據unicode定義,總共有1,114,112個**點,編號從0x0到0x10ffff。換句話說,如果每個**點都能夠代表乙個有效字元的話,unicode標準最多能夠編碼1,114,112,也就是大概110多萬個字元。最新的unicode標準(7.0)已經給超過11萬個字元分配了**點。

**平面

unicode標準把**點分成了17個**平面(code plane),編號為#0到#16。

每個**平面包含65,536(2^16)個**點(17*65,536=1,114,112)。

其中,plane#0叫做基本多語言平面(basic multilingual plane,bmp),其餘平面叫做補充平面(supplementary planes)。

unicode7.0只使用了17個平面中的6個,並且給這6個平面起了名字,如下

public string getchinesebyunicode(string sunicode) 

}} else

}return outbuffer.tostring();

}

中文 unicode互轉

中文,unicode互轉。網上有些只有一種轉換,有些有問題。自己測試無問題,主要用於解決odb資料庫問題。將中文轉化為unicode碼 public static string gbk2unicode string str return result.tostring public static b...

中文 unicode互轉

中文,unicode互轉。網上有些只有一種轉換,有些有問題。自己測試無問題,主要用於解決odb資料庫問題。將中文轉化為unicode碼 public static string gbk2unicode string str return result.tostring public static b...

中文 unicode互轉

中文,unicode互轉。網上有些只有一種轉換,有些有問題。自己測試無問題,主要用於解決odb資料庫問題。將中文轉化為unicode碼 public static string gbk2unicode string str return result.tostring public static b...