Unicode字元處理

2021-06-26 10:13:34 字數 939 閱讀 2324

windows 下程式設計字元的處理

在對字元的編碼中,習慣用乙個位元組表示乙個字元,ascii字元採用這樣子的編碼方式,因此最多隻

能表示256中字元。

在程式設計中如果要對軟體進行本地化,字元的表示就是乙個需要解決的問題,對於象形文本的表示,

乙個位元組是遠遠不夠的,因此就提出unicode字元編碼,用兩個位元組來對字元進行編碼。因此,總共可以

得到65000個字元。對於unicode編碼的相關細則,請查閱相關資料。

windows 2000:既支援unicode也支援ascii,但是有一點需要明確,它的核心只支援unicode.

windows 98:只支援ascii。

windows ce:只支援unicode。

com:com中需要字串的介面方法只能接受unicode字串(因為com通常用於使不同的元件能夠互

相進行通訊,而unicode則是傳遞字串的最佳手段)。

在進行windows程式設計時,為了能編寫通用的程式**,對字串的處理,我們盡量使用作業系統以及

c執行庫提供的轉換巨集。在c執行期庫下,這組巨集包含在tchar.h標頭檔案中(如果要使用unicode,需要定義

_unicode),而對於作業系統來說,如果需要使用nicode,需要定義unicode,而不僅僅是_unicode。所

以這裡你需要定義這兩個巨集。

_t/_text 根據是否定義了_unicode而決定是否採用unicode.

l 轉換為unicode字符集。

下面是乙個ascii到unicode的轉換:

bool ansitounicode(pstr pansi,pwstr *punicode)

unicode到ascii的轉換:

bool unicodetoansi(pwstr punicode,pstr *pansi)

使用完後記得呼叫heapfree()釋放分配的資源。

ansi字元,unicode字元

編碼指不同國家的語言在計算機中的一種儲存和解釋規範 ansi與ascii 最初,internet上只有一種字符集 ansi的ascii字符集 american standard code for information interchange,美國資訊交換標準碼 它使用7 bits來表示乙個字元,總...

Unicode字元編碼

ascii碼 最早的字元編碼,使用乙個byte的7位來表示128種字元 控制字元,控制符,小寫字母,大寫字母,數字,標點,運算子等 然而對於英語國家來說,基本夠用 但對於使用非英文本元的國家來說,就不夠用了。擴充套件ascii碼 為了滿足需要,各國在相容ascii碼的基礎上對128 155等位元組進...

Unicode字元列表

除非有特別指明,否則以下符號皆屬 半形 而非 全形 程式碼顯示 描述u 0020 空格u 0021 嘆號 u 0022 雙引號 u 0023 井號 u 0024 價錢 貨幣符號 u 0025 百分比符號 u 0026 英文 and 的簡寫符號 u 0027 引號 u 0028 開 圓括號 u 002...